検索エンジン スパム(Search Engine Spam)についての解説。不正な方法でロボット型検索エンジンを攻略し、検索結果の上位を得ることを「検索エンジン スパム」といいます。

検索エンジンスパムの定義

残念ながら「何がスパムで、何がスパムではないのか」ということについては、それぞれの検索エンジンのその時の内部基準によって判定されるものであり、ペナルティの発動やその条件なども一定しません。したがって管理者は「疑わしいことはしない」というポリシーで臨むしかありません。

しかし一般に知られているスパムについての定義もあり、それを指針として利用することもできます。検索エンジンスパムについて最もよく使われる定義は次のものです。

検索エンジンスパムに該当すること
ロボット型検索エンジンの適合度を計算する能力に影響を及ぼすあらゆる人為的な試み
検索エンジンスパムに該当しないこと
検索エンジンが存在しなかったとしても同じように行われ続けること、または検索エンジンが行うことを許可していること。

上記定義の「検索エンジンスパムに該当すること」は少々極端なもので、これだけで定義を完結するには不十分で厳しいものです。というのは、検索エンジンはウェブページの内外のあらゆる要素から適合度を計算するため、ウェブページはそれ自体がロボット型検索エンジンの適合度を計算する能力に影響を及ぼす人為的な試みの集合であるからです。

そこで次の定義「検索エンジンスパムに該当しないこと」を除外する必要があります。この「検索エンジンスパムに該当しないこと」の中で述べられている、「検索エンジンが存在しなかったとしても行われ続けること」という定義は非常に示唆に富んでいます。

例えば、隠しテキストや隠しリンク、クローキングなどは、人間の閲覧者に見せることを目的とせず、ロボット型検索エンジンのスパイダーにだけ読み込ませることを目的としてキーワードを配置するテクニックです。このようなテクニックは「検索エンジンが存在しなかった」場合には当然使われ続けることはありませんから、明確にスパムとみなすことができます。

スパムとペナルティ

悪質な検索エンジン スパム行為が発覚した場合、そのような行為を行ったページはロボット型検索エンジンからペナルティーを課されることがあります。各検索エンジンは、それぞれの独自の基準に則ってスパムサイトを自動的に判別し、該当するサイトにペナルティを課します。スパムに対するペナルティとは、具体的には以下のようなものです。

検索結果からの除外
それほど悪質なスパム行為でない場合の措置で、単に検索結果リストの上位に表示されなくなる。最下位付近まで表示順位を落とすこともあれば、緩やかに表示順位を下げることもある。
データベースからの削除
悪質なスパム行為を行った場合、次回のクロール時からクロール対象リストから除外され、データベースから完全に削除される。ページやディレクトリ単位の場合もあれば、ドメインごと削除される場合もある。

ただし現状では、明らかにスパムとして判定されペナルティを受けている、というケースは非常に稀なものになっています。これは一部の例外を除いてスパム行為による上位表示は不可能になりつつあるというこであり、ウェブマスターの立場から見れば、必要以上にスパム判定を恐れる必要が減ってきたという意味で望ましいことです。

また運悪くペナルティを受けたような場合でも、Googleガイドライン違反ペナルティの解除方法に従って作業を進めることで、ほぼすべてのペナルティは解除可能です。この点からも、現状ではスパムについてそれほど神経質になる必要は大きくないと言えます。

スパム行為の具体例

Google ウェブマスターのためのガイドラインには「品質に関するガイドライン」として、スパム行為の具体例がいくつか示されています。これについて以下にまとめます。

企みを持ったリンク組織に参加しない
  • リンクポピュラリティや検索順位を組織的に上昇させようとする計画に参加しない
  • 過剰な相互リンクをしない
  • 有料リンクを購入しない・販売しない
  • 組織的なリンクを持っているサイト(リンクファーム参加サイトや有料リンク販売サイト)にリンクしない
隠しテキスト、隠しリンクを使用しない
  • ユーザーには見せずに、検索エンジンにだけ読み取らせることを意図したテキストやリンクを配置しない
  • 背景と同色のテキストやリンクを使用しない
  • 小さな画像やハイフンなどの記号に設定されたリンクを使用しない
  • 画像で覆われたエリアや表示エリア外に大量のテキストを記述しない
クローキングを行わない
  • UAやIPで判別して、ユーザーに見せる内容とは異なる内容のページを検索エンジンのロボットに対して表示することはしない
JavaScriptを悪用しない
  • 実際のJavaScriptの動作とは異なる内容をnoscript要素内に記述しない
  • ユーザーを検索結果に表示されたページとは別のページにリダイレクトする目的でJavaScriptを使用しない
ドアウエイページを使用しない
  • 別のページへのリダイレクトを目的として、特定のキーワードやキーフレーズにだけ最適化された内容のないページを作成しない
キーワードを詰め込まない
  • リストや段落の中で特定のキーワードを過度に繰り返し使用しない
  • 隠しテキストの中にキーワードを詰め込まない
  • title属性やalt属性の値の中にキーワードを詰め込まない
内容の重複したページを公開しない
  • 検索エンジンの順位を操作する目的で、同じか類似の内容を持ったページを複数のドメイン・サブドメインで公開しない
  • まったく同じ内容で、キーワードだけが異なるページを公開しない
  • (注 1: 印刷用バージョンやモバイル用バージョンを用意することは問題ないが、正規化するかrobots.txtなどでブロックした方がいい
  • (注 2: サイトの構造やドメインを変更した場合には、301リダイレクトを使用する
  • (注 3: 類似のページが複数ある場合には1つにまとめるか、それぞれのページに固有の情報を追加した方がいい
  • (注 2: コンテンツをシンジケーションする場合には、オリジナルへのリンクを含める

上記はGoogleがペナルティを与える可能性があると公表しているものですが、実際のところこれらのほとんどは、注意する必要すらないものばかりです。もしペナルティを受けたと思われる場合には、「Googleガイドライン違反ペナルティの解除方法」を参照してください。

スパムの報告

検索エンジンスパムは、すべてのインターネットユーザーに損害を与える非常に悪質な行為です。検索結果が不当に操作されれば、検索サイトの運営者にとっても、検索エンジンのユーザーにとっても有害なものです。このような検索エンジン スパムを発見した場合には、検索サイトにスパムサイトを報告することができます。