※ 2019/8/11:リファラースパムの問題はGoogle側も認識していて、この問題を解決するための取り組みを行っているとのことです。Google Analyticsの対策が導入されるまでは当エントリーの除外リストも随時更新しますので定期的にご参照ください。
重要ポイントは…
- リファラースパム(リファラスパム)とは?
- リファラースパムにアクセスする前に確認する
- アクセス解析からログを除外する(表示させない)
- リファラースパムドメインの一覧(2019/8/11現在)
- とにかくアクセスしないこと
リファラースパム(リファラスパム)とは?
最近多くの方が迷惑を受けているリファラースパムについて、考察が聞きたいというリクエストをいただいたので、簡単ではありますが私なりの考察と対策を書きたいと思います。
そもそもリファラースパム(リファラスパムとも言います)って何?という人がいるかも知れないので簡単に説明します。
リファラーは「どのサイトからやって来たか」というリンク元(URL)の情報です。
アクセス解析などでユーザーがどこからやって来たか、被リンクのチェックを行うため、リファラー情報をチェックするのですが、あるリンク元、URLからの流入が多く記録されている・・・なんてことがあります。
確認のために実際にそのリンク元に行ってみると英語ばかりのページ、いかにも怪しい情報商材の販売ページ、アダルトなページ・・・etc だったりします。
これはリファラー情報を偽装することで、サイト管理者にアクセスさせることを狙いにしているものです。
(その他、ユーザーエージェント情報なども偽装していることが多いですがここでは割愛します。)
該当ページに被リンクが貼られていないのはもちろん(ていうかそんなサイトからの被リンクはいらないですが)、ボットを使ってアクセス解析にログを残すだけのものなので、実際にサイトにはアクセスが行われていないデータなのです。
この手のサイトはウィルス感染やアクセス数の水増し、アフィリエイトのリンクを踏ませることを目的としていますので、こちらからアクセスをしないことが一番の対応方法です。
リファラースパムにアクセスする前に確認する
とはいえ、明らかに怪しいドメイン、URLだとすぐにリファラースパムだと分かるのですが、最近は短縮URLを使うことで、なかなか見分けがつかないこともあります。
実際にアクセスする前に検索エンジンでドメイン、URLを検索することである程度は分かりますので(その際、ダブルクオーテーション「"」でドメイン、URLを括ってください)、それで調べてみるのも一つの方法です。
(検索結果に引っかからない場合はそのページがインデックスされていない、つまりは「その程度のページである」という判断も出来ます。)
また、その手のサイトには二度とアクセスしないようにフィルタリングソフトを使うのも一つの方法です。
※ 下記にChromeブラウザの拡張機能が紹介されています。参考にしてみてください。
3分LifeHacking:目的別:見たくないサイトをブロックできるChrome拡張機能5選 (1/3) - 誠 Biz.ID
アクセス解析からログを除外する(表示させない)
こちらから該当のサイトにアクセスすることはある程度は防げますが、ボットは相手側が動かし続けている、悪質行為を続けているため、アクセス解析のログには依然としてリファラースパムが記録され続けてしまいます。
そこで、アクセス解析からログデータを除外する(正確に言えばフィルタリングを行う)方法をご紹介します。
(今回の説明は「Google Analytics」を例とした、フィルタリングを行う方法です。)
1.Google Analyticsにログインし、「アナリティクス設定」をクリックします。
2.ビューの配下にある「フィルタ」をクリックし、更に右に表示された「新しいフィルタ」をクリックします。
3.下記の画面で必要事項を入力、選択していきます。
・フィルタ名はお好きな名前をつけてください。
(分かりやすいものがいいでしょう。)
・フィルタパターンは正規表現で入力します。
(ピリオドの前に半角のバックスラッシュを挿入します。)
※ 例はドメイン名「hogehoge.com」です。適宜変更してください。
4.最後に保存をクリックして完了です。
この方法だと一つのドメインしか除外できない、複数ある場合はその都度追加していかないといけないため、かなり面倒くさいのですが、極力やっておくほうがよいでしょう。
また、このフィルタ設定がうまくいかない(「このフィルタはデータに反映されていません」と表示される)ことがあるようです。
これは複数の一致フィルタを設定している場合に多く発生します。
理由は、存在しないフィルタパターンを定義した一致フィルタや、リクエストURIなどの特定のデータフィールドを対象にした複数の一致フィルタでは、条件に一致するデータ(アクセスログ)が存在しないため、データに反映もされないからです。
「アナリティクスにアクセスログとして記録されているものだけ」を登録しましょう。
参考:
アナリティクス 日本版 公式ブログ: 基本編 – トラッキング コードをインストール後にデータが表示されない場合のトラブルシューティング
リファラースパムドメインの一覧(2019/8/11現在)
2019/5/25現在、多くのサイトにリファラースパムを行っているドメイン(URL)は以下の通りです。
主にロシアや中国からのアクセスとして記録され、サブドメインを変えたドメインでアクセスログに多数のスパムログを残していきます。
以下のドメインを軒並みフィルタ登録を行うことを推奨します。
(実際にアクセスすると、違うページへリダイレクトされることも多いのでご注意ください。)
この除外すべきドメインリストは随時更新しています(最終更新:2019/8/11)。
ブックマークやお気に入りに登録して、定期的にご参照ください。
darodar.com
econom.co
ilovevitaly.com
ilovevitaly.co
iskalko.ru
blackhatworth.com
aliexpress.com
hulfingtonpost.com
bestwebsitesawards.com
lumb.co
o-o-6-o-o.com
humanorightswatch.org
simple-share-buttons.com
floating-share-buttons.com
free-social-buttons.com
addons.mozilla.org
googlsucks.com
theguardlan.com
buy-cheap-online.info
pornhub-forum.ga
theguardlan.com
event-tracking.com
guardlink.org
sanjosestartups.com
xn--80adgcaax6acohn6r.xn--p1ai
howtostopreferralspam.eu
erot.co
e-buyeasy.com
pops.foundation
chinese-amezon.com
sexyali.com
hongfanji.com
qualitymarketzone.com
rednise.com
alibestsale.com
copyrightclaims.org
snip.to
get-your-social-buttons.info
adf.ly
black-friday.ga
cyber-monday.ga
lsex.xyz
quit-smoking.ga
rusexy.xyz
o-o-8-o-o.com
santasgift.ml
googlemare.com
traffic2cash.xyz
topseoservices.co
semrush.com
w3javascript.com
for-your.website
easywebinar.com
teslathemes.com
годом.рф
snip.tw
2your.site
nufaq.com
trafficgenius.xyz
hdmoviecamera.net
google-analytics.com
web-revenue.xyz
ilikevitaly.com
net-profits.xyz
spacebarnot.work
wordpresscore.com
adtiger.tk
getrichquickly.info
makeprogress.ga
rank-checker.online
socialbuttons.xyz
getrichquick.ml
6hopping.com
free-social-buttons1.xyz
fuck-paid-share-buttons.xyz
hdmoviecams.com
hdmoviecamera.net
increasewwwtraffic.info
unpredictable.ga
topquality.cf
dominateforex.ml
getlamborghini.ga
ownshop.cf
burn-fat.ga
ghostvisitor.com
monetizationking.net
easycommerce.cf
cookie-law-enforcement-aa.xyz
marketland.ml
magicdiet.gq
law-enforcement-gg.xyz
law-enforcement-check-two.xyz
law-enforcement-check-three.xyz
ilovevitaly.xyz
site-auditor.online
free-social-buttons-aaa.xyz
cookie-law-enforcement-dd.xyz
free-social-buttons.xyz
bestchoice.cf
pokemongooo.ml
ranking2017.ga
luxmagazine.cf
bestofferswalkmydogouteveryday.gq
itrevolution.cf
doyouknowtheword-flummox.ml
alert-eje.xyz
biketank.ga
asacopaco.tk
pogodnyyeavarii.gq
californianews.cf
fashionindeed.ml
spin2016.cf
social-s-iii.xyz
ranking2017.ga
bestchoice.cf
bestofferswalkmydogouteveryday.gq
exchangeit.gq
kiwi237au.tk
turkeyreport.tk
law-five.xyz
nyfinance.ml
bugof.gq
ussearche.cf
1-free-share-buttons.com
familyholiday.ml
eyes-on-you.ga
gq-catalog.gq
free-share-buttons.top
compliance-jack.top
homemade.gq
pinkduck.ga
alfabot.xyz
arendovalka.xyz
begalka.xyz
bezlimitko.xyz
biteg.xyz
boltalko.xyz
site-auditor.online
abcdefh.xyz
advokateg.xyz
site-speed-check.site
24x7-server-support.site
site-speed-checker.online
website-speed-check.site
speedup-my.site
compliance-alex.xyz
compliance-ivan.xyz
compliance-irvin.xyz
compliance-don.xyz
compliance-barak.xyz
compliance-checker.info
brateg.xyz
budilneg.xyz
buketeg.xyz
bukleteg.xyz
thenextweb.com
lifehacĸer.com
lifehacer.com
ɢoogle.com
blackhatworld.com
googleapis.com
google-liar.ru
vc.ru
e-commerce-seo1.com
ecommerce-seo.org
express-seo.net
semalt.com
3-letter-domains.net
free-fb-traffic.com
sharebutton.net
interferencer.ru
piulatte.cz
nodepm.com
improve-your-rankings.com
autoseo-traffic.com
rankexperience.com
money-for-placing-articles.com
earn-from-articles.com
sellfbgroup.com
fb-data-domain.com
sell-fb-group-here.com
5-steps-to-start-business.com
ḷ.com
blackhatworld.com
seojokes.net
31trustedlinks.com
kickvox.com
cheap-trusted-backlinks.com
auto-seo-service.com
auto-seo-service.org
autoseo-service.org
autoseoservice.org
resell-seo-services.com
your-seo-promotion.com
your-seo-promotion-service.com
my-seo-promotion-service.com
my-seo-promotion.com
worldwide-seo-services.com
free-seo-help.org
seo-services-with-results.com
get-seo-help.com
free-seo-consultation.com
analytics-for-seo.com
seo-for-b2b.com
seo-b2b.com
seo-b2b-analytics.com
autoseo-b2b-services.com
seo-services-b2b.com
seo-services-wordpress.com
autoseo-b2b-seo-services.com
local-seo-for-multiple-locations.com
9-reasons-for-seo.com
12-reasons-for-seo.com
15-reasons-for-seo.com
16-reasons-for-seo.com
17-reasons-for-seo.com
99-reasons-for-seo.com
100-reasons-for-seo.com
1-best-seo.com
7-best-seo.com
9-best-seo.com
dailyseo.xyz
xtrafficplus.com
promotion-for99.com
autoseo-expert.com
bestecommerceseo.com
nbok.net
coverage-my.com
2-go-now.xyz
blogtips.top
secret-promotion.com
2-easy.xyz
lapik1.xyz
500-good-starts.xyz
great-n1.xyz
ann-advert1.xyz
check-pro1.xyz
bravenet.top
amazonanete.info
rakurakutennaw.info
yehouu.com
tpointsales.com
goglenewsup.info
rakutenpicks.com
altrtokyu.com
googruu.com
tokujyoho.com
また、最近はリンク元としてアナリティクスのログに記録するのではなく、検索キーワードに「スパムURLやドメインを書き込む(該当URLで検索されたように偽装する)方法」も横行していますので注意してください。
結局はいたちごっこだけれど…
とにかくアクセスしないこと
相手の目的は「該当のサイトにアクセス」をさせることです。
とにかくこちらからはアクセスしないこと、それしか対策はありません。
この手のスパムは手を変え品を変え行われるので、対策を行ってもいたちごっこになってしまいますが、何も対策をせずにいることはスパムをのさばらせることと同義でありますので、面倒くさいですが都度対策を行うことで防いでいきましょう。
(こうして対策を行うことはもちろん、相手の手法、手口を情報共有することも有効な手段になり得ますし、Analyticsを提供しているGoogleに情報提供することにも繋がります。)
【追記】
リファラースパムの問題はGoogle側も認識していて、現在この問題を解決するために取り組んでいるとのことです。
【アクセス解析】Googleアナリティクス全体でリファラースパムを除外する仕組みが導入されます - 検索サポーター
また、Google Analyticsにてボットやクローラーからのトラフィック(アクセスログ)を排除する方法もありますので、ご参考にしてください。
【Google Analytics】ボットやクローラーからのトラフィックを除外する新機能 - 検索サポーター
【再追記】
Googleアナリティクスで簡単設定!リファラースパムのフィルタ除外登録を一発で完了させる方法|アナリティクスガイド
新しいリファラースパムが出る度にフィルタの元となるブラックリストも更新されるので、その都度、Googleアナリティクスと紐づけしないといけませんが、それでもいちいち自分で打ち込むよりは作業量はかなり軽減されますね。
急増するGAのリファラースパムを撃退! スパム業者の手口とは? | <特集>ユニバーサルアナリティクスの新しい仕組み「Measurement Protocol」とは? | Web担当者Forum
ホスト名を自社ドメインのみに絞って表示する「セグメント方式」について書かれています。
スパムと思われる怪しいホスト名を除外してアナリティクスのデータを表示させる方法です。
当ページのフィルタリングする方法と合わせて使ってみてください。