SEO

リファラースパムとは?アナリティクスでの対処法を解説

おじさんは疲れてくるとアナリティクスのリアルタイムレポートを見て心を落ち着けるクセがあるんですが、あるとき突然20件くらいのアクセスがきたんですよね。しかも同時に。一瞬、「ついにおじさんの時代きたか!」と思ったんですが、「これはなんか怪しい・・・」と野生の勘が働いたので調べてみたらリファラースパムと呼ばれるスパムの一種みたいです。

今回はそのリファラースパムの対処法について書きました。

リファラースパムとは?

リファラースパムというのはリファラーを利用してスパムサイトへの誘導をしようとする迷惑行為らしいです。

リファラー(referer)というのはあるページAからリンクをクリックして別のページに移る時のリンク元のページAを指します。参照元とも言うようです。

Googleアナリティクスではどんな参照元からアクセスがあったのかを調べることができますが、それを逆手にとってスパムサイトへ誘導しようとするのがリファラースパムです。

Googleアナリティクスで参照元サイトのデータを見るとよくわからない参照元が並んでいることがあります。おじさんが運営してるあるサイトの場合以下のような感じです。赤枠のやつがリファラースパムです。

アナリティクス-参照元一覧

アナリティクス先生は残念ながらリファラースパムによるアクセスもカウントしてしまうので、放置しておくと正確に分析できなくなってしまいます。なので、フィルタ機能を使って除外しておく方が良いですね。

 

リファラースパムの対処法

リファラースパムはGoogleアナリティクスのフィルタ機能を使って除外できます。主に以下の2つの方法があるようです。

  1. ボットのフィルタリング
  2. ビューのフィルタリング

①の方が簡単ですが、ホントに除外されるのかよくわからないのでおじさんは②もやってます。

 

ボットのフィルタリング

やり方は簡単です。まずはアナリティクスの管理画面にいき、ビューの設定を選びましょう。

ボットのフィルタリング方法1

 

ビューの設定の下の方に行くと「ボットのフィルタリング」という項目があるのでチェックを入れます。あとは保存して完了です。超簡単。

ボットのフィルタリング方法2

ボットのフィルタリングについての詳細はこちらをご覧ください。

 

ビューのフィルタリング

こちらも簡単です。まずは管理画面にいきましょう。アナリティクスのホームから管理画面に行くには左下の「管理」をクリックしましょう。

 

管理画面に行ったら、「ビュー」>「フィルタ」をクリック。

リファラスパム対策2

 

「フィルタを追加」をクリック。

リファラスパム対策3

 

リファラスパム対策4

以下のように設定します。

  • フィルタ名:リファラスパムのアドレス
  • フィルタの種類:カスタム>除外
  • フィルタフィールド:参照
  • フィルタパターン:リファラースパムのアドレス

フィルタ名は任意なのでなんでも良いですが、おじさんはわかりやすくするためにリファラスパムのアドレスをそのまま使っています。

フィルタの種類はデフォルトでは「定義済み」になっていますが、これだと参照元を条件にしたフィルタリングができないのでカスタムにします。

フィルタフィールドは「参照」にするとフィルタパターンに入力した参照元を対象にしてくれます。

最後に保存するのを忘れないようにしましょう。

 

リファラースパムかどうかを判断する方法

参照元をチェックするにはアナリティクスで「集客」>「すべてのトラフィック」>「参照元/メディア」と進みましょう。

アナリティクス-参照元の場所

「google / organic」はgoogle検索からサイトへアクセスしてきたやつです。

肝心のリファラースパムの見分け方ですが、以下の条件に当てはまったらほぼリファラースパムと考えて良いと思います。

  1. 直帰率が100%
  2. ページ/セッションが1.00
  3. 平均セッション時間が00:00:00

これは1つのページにとどまりそのまま帰ったことを示しています。ただし、そのページをちゃんと見てる人という可能性もあります。セッション時間はあるページAにアクセスしてから他のページへ移動するまでの時間を指しますが、他のページへ移らない限りはすべて00:00:00とカウントされます。つまり、1ページだけ見て帰った場合はすべて00:00:00となります。上記条件だとリファラースパムか本物の人間によるアクセスなのか完全には判断できません。

平均セッション時間については以下の記事で解説してあります。

平均ページ滞在時間と平均セッション時間の違いアナリティクスの「平均ページ滞在時間」と「平均セッション時間」の違いが実はよくわかってなかったので調べてみました。平均セッション時間が00:00:00と表示されている意味もわかったのでそれも含めて解説します。...

なので他の判断材料が必要になります。参照元のアドレスにseo、ads、market」などのワードが入ってたらリファラースパムを疑うと良いと思います。

最初に書いたようにおじさんはヒマさえあればアナリティクスのリアルタイムレポートを見てるんですが、見ているときたまにリファラースパムが来ることがあります。リアルタイムレポートでは参照元もチェックすることができます。

アナリティクス-リアルタイムレポート-参照元の場所

Google検索などからきた場合は参照元には「ものビューにはデータがありません。」と表示されますが、どこかのリンクを踏んでアクセスしてきた場合はここに参照元のアドレスが表示されます。

リファラースパムからアクセスがあると一気に20件くらいアクセスが増えるのすぐにわかるのですが、その時にこの「上位の参照元」を見るとだいたいseo、ads、marketみたいなワードが含まれています。

 

「集客>参照元/メディア」の情報と参照元にseo、ads、marketのワードが含まれているかどうかでだいたい判断できますが、それをいちいちチェックするのは面倒だなあと。調べてみたらリファラースパム一覧を整理しているまとめがありましたが、これ更新が2016年8月で止まってるので情報が少し古いですね。

とりあえずボットフィルタを設定しておけば大丈夫だと思います。それでも除外できない場合は、「集客>参照元/メディア」でチェックして1つずつフィルタをかけましょう。

 

まとめ

最後にまとめておきます。

  • 参照元にseo、ads、marketというワードが含まれてたらほぼリファラースパム
  • 直帰率100%、ページ/セッションが1.00、平均セッション時間が00:00:00だったらほぼリファラースパム
  • リファラースパムはボットフィルタかビューのフィルタで除外できる