ほとんど同じ内容のURLを複数作り、検索エンジンに登録、検索結果の上位を独占する複製ページスパムに関する解説。
ほとんど同じ内容のURLを複数作り、検索エンジンに登録するトリック
本質的には同じ内容のページを複数作り、検索エンジンに登録するトリックを「複製ページ スパム」といいます。
ほとんど同じ内容のページを複数登録し、検索結果の上位を独占したり、すべての同義語でポジションを取ったりするためにおこなわれます。
同じドメイン内でおこなわれることもあれば、複数のドメインやサブドメインを使って大々的におこなわれることもあります。
これはアダルト業者によって古くから使われていた古典的なスパム手法で、残念ながら現在でもやり方によっては通用してしまいます。
複数のドメインを使ってこのトリックを使う場合、検索結果リスト上位のほとんどを特定業者のサイトが埋め尽くし、検索結果リストをゴミの山に変えてしまうことになります。
この意味からも、非常に悪質なスパム行為であると言えます。
はびこる複製ページスパム。対処法は?
残念ながらこのトリックは、日本国内の「自称検索エンジン最適化業者」の中でもわりとポピュラーなトリックになっているようで、検索エンジン最適化の関連用語で検索をかけると、彼らの宣伝用に作られたほとんど同じ内容の多数のサイトがヒットします。
彼らのようなスパマーたちが、彼ら自身の手によって自分たちの市場を汚していることに早く気づいてくれることを願います。
もしこれを読んでいる方が検索エンジン最適化のアウトソーシングをお考えなら、このサイトで学んだ知識によって武装し、このようなスパム業者に仕事を依頼することのないように注意するべきです。
また、あなたのサイトがこのようなスパム業者によって仕掛けられた複製ページスパムによって迷惑を被っているのであれば、速やかに検索エンジンの運営者に報告すべきです。
たとえばGoogleであれば、Report a Spam Resultのようなページを用意して、このような報告を受け付けています。
善意のインフォメーションページがスパムとみなされることも
日本語には多数の同義語があるだけでなく、「送り仮名の違い」や「漢字と仮名」などの表記の違いによって、まったく同じ意味の言葉に複数の表記のしかたが存在します。
以下にその例を挙げます。
- 送り仮名の違いの例
- 「引っ越し」「引越し」「引越」
- 表記の違いの例
- 「シロアリ」「白アリ」「白蟻」
これらは検索エンジンが搭載している辞書の仕様によって、同じ語とみなされることもありますが、多くの場合別のキーワードとして認識されます。
(フレッシュアイやLycos WiseNutは優秀な辞書を搭載しているようです)
これらの表記の違いを吸収するために、まったく同じ内容のページで、キーワードの部分だけを書き換えたインフォメーションページを作ったとします。
- 「引っ越し」の表記に最適化したページ
- 「引越し」の表記に最適化したページ
- 「引越」の表記に最適化したページ
といった具合です。この場合、文書のほとんどの部分が同一のファイルが複数作られることになりますが、検索エンジンはこういった「ほとんど同じ内容のページ」を見分けてペナルティーを与え、検索結果の上位から排除します。
複数の表記について、それぞれの表記を使用して最適化したページを作る際には、必ず「内容も変えて作る」ことが大切です。
ファイル名の付け方にもこだわってみる
検索エンジンが複製ページスパムを見分けるための材料として、HTMLのファイル名を使うことがあります。
せっかくユニークな内容でページを作成しても、同じようなファイル名をたくさん使うことでスパムとみなされてしまっては意味がありませんので、この点にも気を付けるべきです。
使うべきではないファイル名とは、前述の例でいえば、以下の例のような続き番号のついたファイル名などは要注意です。
- hikkoshi1.html
- hikkoshi2.html
- hikkoshi3.html
内容だけでなくファイル名もユニークなものを使用するように心がけ、不本意なスパム扱いを受けないように対策しましょう。

