Googleアナリティクスのスパム「trafficbot.live(.life)」除外方法
CND Sekiguchi
今月に入って、Googleアナリティクスでスパムと思われるアクセスが見受けられます。
私が現時点で確認できているスパムと思われるアクセスは以下の2種類です。
trafficbot.live
trafficbot.life
このようなスパム除外に対する考え方と取り急ぎの除外方法をご紹介します。
今回も「ホスト名」を利用して除外したかったのですが・・・
数年前、リファラースパムによるアクセスが大量に出た時がありましたが、あの時はホスト名が(not set)など自社ドメイン以外のアクセスであったため、“ホスト名を自社ドメインのみ”に設定することによって対処可能でした。
しかし、今回の「trafficbot」はホスト名を確認すると自社ドメインで記録されてしまっているので、ホスト名を自社ドメインのみに設定しても「trafficbot」は除外はできません。
ちなみに、/trafficbot.liveの参照元には「Google自然検索」も含まれているので、参照元(trafficbot.live / referral)ベースでは除外しきれません。
取り急ぎの除外方法として
これがベストな方法かは分かりませんが、取り急ぎ、フィルタでサブディレクトリ /trafficbot.〇〇〇〇を除外する形で対処しました。
「除外」「サブディレクトリへのトラフィック」「前方が一致」でサブディレクトリは「/trafficbot」
「前方が一致」にすることにより、/trafficbot.live と/trafficbot.life の両方を除外します。
現在、確認できているのは、/trafficbot.live と/trafficbot.life のみですので上記の設定にしましたが、今後、他のディレクトリ名でのスパムが出てきた場合は、フィルタの種類を「カスタム」にして、すべてのパターンを一括で除外するために正規表現を使用する必要も出てくるかもしれません。
最後に
今回のスパムは2月頭の一日のみのアクセスでそれ以降は今のところ見られませんが、今後またアクセスがないとは言えないので、気になる方は除外設定しておいた方が良いと思います。
既にスパムによるログが残ってしまっている件については、関係者間でスパムによる一時的なアクセスがあったという共有ができていれば、そこまで神経質にならなくてよいと思います。
大切なのは完璧なデータを収集することではなく、改善(アクション)に繋がるデータを収集し、精度の高い仮説を立てて、改善の実施、検証を繰り返すこと。こちらに時間と神経を使いましょう。