タイトルタグのトリック

この記事は実話をもとにしてはいますが、物語を使ってSEOをわかりやすくというコンセプトで作られたフィクションです。実在の人物、団体、企業、事件等とは一切関係がありません。

1998年、日増しに暖かくなる気温に気持ちも緩みがちになる春の日のことだった。画面の向こうのチャットルームは、世界中のスパマーたちで賑わっていた。時刻は午後10時。アジアのスパマーにとっては夜、ヨーロッパのスパマーにとっては昼。そろそろアメリカのスパマーたちも起きてくる。

スパマーたちのチャットルーム

ここは世界中のスパマーたちの情報交換の場だ。やりとりはすべて、俺の苦手な英語で行われている。はじめのうちは自分のつたない英語が恥ずかしくて発言できなかったが、中央アジアや東アジアや中央アメリカの連中が発する怪しげな英語に触れるうちに、恥ずかしいなんていう感覚は失せ、発言もできるようになった。

夜更かしのアジア人と、昼休みのヨーロッパ人、早起きのアメリカ人が入り乱れるこの時間帯は、ちょっとしたラッシュアワーだ。有益な情報も飛び交うが、子細を確認するのは難しい。少しでも書き込みを躊躇すれば、話題は先へ先へと流れていく。参加は反射神経が勝負だ。

そんな熱狂的とも言える時間帯、常連の北米人 PositionMonkey の発言が俺の目を引いた。
「これを見てください。私はExciteをxxxxして、彼らに糞を食べさせることに成功しました」

その発言に続いて、US Exciteの検索結果を呼び出すリンクが並ぶ。検索ワードは、Bill Clinton(ビル・クリントン)、Monica Lewinsky(モニカ・ルインスキー)、Presidential Scandal(大統領のスキャンダル)だ。どのキーワードで検索しても、1位にヒットしたのは同じページで「All About “Relationship that was not Appropriate”(不適切な関係のすべて)」というものだった。

ページの内容は、大統領のスキャンダルについての文章も多少はあるものの、大半は出会い系サイトのアフィリエイトだ。これには驚いた。

なにより奇妙なのは、キーワードをタイトルに含まない文書が1位にヒットしていることだ。しかもキーワードは複数で、どれも極めて検索数が多いと思われるものばかりだ。いったいどんなトリックを使えばこんなことができるのか。

俺は素早くソースをチェックした。なんと、タイトルタグが複数ある。全部で12個もの数のタイトルタグだ。俺はすかさず発言した。
「驚きです! 私はこのタイトルタグたちによるトリックを研究する必要があります。あなたの挑戦は必ずみんなの賞賛を浴びます」

ソースを保存しようと再びページを開くと、ソースが書き換わっていた。タイトルタグは「All About “Relationship that was not Appropriate”(不適切な関係のすべて)」と書かれた1個だけになっている。当時の検索エンジンにはソースのキャッシュ機能はない。俺は急いで書き込んだ。

「やあ PositionMonkey、私にはそのコードはすでにアップデートされたように見えます。私は以前のコードを見ることができますか?」
数秒の間があり、レスがつく。

「私がアップデートしたのはtitleタグだけで、その他のコードはそのままです。私が ArchitextSpider に食べさせた xxxx’n コードでは、私は正しいタイトルタグの下に、キーワードだけを書き入れたタイトルタグを並べていました。あなたが入れるべきタイトルタグの数は、1つのキーワードについて3つずつです」

「あなたに感謝します。私は今すぐにそれを試みます。私がうまくExcite Japanのお尻を蹴ることができたら、私はすぐにここで報告するでしょう」
たまにこういうことがあるから、海外の最新情報を追うことはやめられない。

ランキングアルゴリズムの盲点を突く

1998年当時の検索エンジンのランキングアルゴリズムは、どれもそう賢いものではなかった。キーワードとコンテンツの関連性が高いとみなされる要因を満たすごとにスコアを加点していき、そのスコアの合計点が大きいものから順に検索結果に表示される、というような単純なものだ。

例えば、あるキーワードについて、title要素にそのキーワードが含まれていればプラス10点、b要素に含まれていればプラス2点、h1要素に含まれていればプラス1点、といった具合にスコアを加算し、そのスコアの合計の高いものほど高い順位を得る、というわけだ。

ただし、やり過ぎてスコアが閾値を超えるようなことがあると、スパムとみなされてbanされる。したがって、無闇にキーワードを詰め込めばいいというものでもない。スパマーの腕の見せ所は、この閾値を探り、閾値ぎりぎりのファイルを作ることだった。

Exciteの場合、title要素の中でキーワードを3回以上繰り返すのはNG、というのがスパマーの間で共有されていた常識だった。ところが今回の情報では、title要素そのものを複数回記述することによって、1つのtitle要素の中で使えるキーワードの回数の制限を突破してしまった。

Excite検索の開発者も、まさか1つのhtmlファイルにtitle要素を10回も書き入れるスパマーの登場は想定していなかったのだろう。検索エンジンの開発者でも気づかないような盲点を鋭く突いたスパマーの大勝利だ。

スパマーのコミュニティーへの貢献

今回のトリックも、実際やってみるまでは日本のExciteに通用するかはわからない。しかし成功すればとんでもない儲けが転がり込む。検索ポータルとしてのExcite Japanは、前年末に日本でのサービスを開始したばかりだが、わずか数ヶ月のうちに急成長を遂げている注目株だ。今のうちから仕込んでおくのは悪くない。

それに、日本語での攻略が成功し、その方法を海外のスパマー連中と共有すれば、コミュニティに貢献できる。より多く貢献する奴ほど多くの信頼を集める、というのはスパマーのコミュニティでも同じことだ。コミュニティに参加するのは、そこから得られる情報だけがインセンティブじゃない。貢献できるという実感が得らることもまた、重要なインセンティブだ。

日本語なんていうローカルの情報でも、求めている奴はたくさんいる。東アジアの連中だ。台湾のスパマーが使う北京語や、香港のスパマーが使う広東語、韓国のスパマーが使う朝鮮語などは、日本語と同じく2バイトで、ヨーロッパ言語と違って単語と単語の間にスペースがないことも共通だ。日本語での事例は、彼らの役に立つ。

俺は猛然と作業を開始した。今夜は長い夜になる。

フリーのホームページページスペース上での戦い

スパマーたちは検索エンジン別に異なるページを使って最適化する。Lycos用、Infoseek用、Excite用、Altavista用、Inktomi用、といった具合だ。検索エンジン別にページを作るのは、検索エンジンごとに加点配分やbanまでの閾値が異なるからだ。それぞれのファイルは、対応する検索エンジンに対してのみ、極限まで最適化される。

こうしたファイルは、対象外の検索エンジンに読み込まれると、しばしばbanされ、その被害が同じドメイン上の他のファイルにまで及んでしまうことがある。対象外の検索エンジンにとっては、閾値を超えているのだ。

だからスパマーは、対象とする検索エンジンだけがそのファイルにアクセスできるように、robots.txt を設定する。Exciteだけが対象なら、ArchitextSpider だけにアクセスを許可し、その他のロボットを許可しないようにすればいい。より用心深い人なら、robots.txt ではなく、httpd.conf や .htaccess で制御する。UAだけでなくIPでも判別するのもいい。

しかし俺の場合は、例えそれがExcite専用のファイルだったとしても、他の検索エンジンを排除することはしない。ロボットは何でもウエルカムだ。そうしたほうが、他の検索エンジンの挙動が見れるので、かえっていいくらいだ。

俺は新しいトリックを試すたびにフリースペースに新しいアカウントを取得し、そこにファイル一式を置くようにしているので、最悪banされてしまっても特に問題ない。どうせフリースペースだ。また新たに確保できる。そもそも、今回のような危なそうなトリックを自前のサーバで使う奴はアホだ。

俺はフリーのメールアドレスを1つ用意し、それを使って Geocities と Tripod、それにEngelFire の計3ヵ所を回って、フリーのWebスペースを新たに確保した。どれもUSのサイトだ。わざわざUSを使うのは、どのサービスもUSが飛び抜けて利用者が多いため、少々無茶をしても目立たないだろうという目算からだ。もちろん、中米や西欧だと言葉の壁があることもある。

日本語圏向けスパムファイルの生成

次の作業はファイル作りだが、これはもうほとんど自動でできてしまう。というのも、今回のトリックの対象であるExciteでは、ファイルが人の目に触れることを考えなくてもよく、したがってきちんとした文章や画像を用意する必要がないのだ。Exciteはインデックス更新の間隔が極めて長いために、このようなことが可能となる。

インデックスの更新は、新たなページを見つけるために逐次データベースに追加していく方式と、定期的にすべてのインデックスをまるごと更新する方式の2通りがあり、Exciteは後者だ。そして、その更新頻度は3ヶ月から6ヶ月に1度と、かなり間隔が長い。

これはつまり、新しいページがExciteの検索結果に表示されることを確認したら、ページを別のものに差し替えてしまっても、次の更新までの3ヶ月から6ヶ月はそのままの順位で表示され続ける、ということを意味する。検索結果の上位を確保したら、あとは好きな内容に差し替えるなり、どこか別のページにリダイレクトするなりすればいい。

インデックスを逐次更新する方式の検索エンジン、例えばInfoseekやLycosでは、こうはいかない。巡回申請を出してから新しい内容がインデックスに反映されるまでの期間が、Infoseekでは1日から3日、Lycosでは5日から8日ほどだが、このように更新が早いと、ページの内容を差し替えた場合、ライバルがさらに巡回申請を出してしまえばそれまでだ。数日後には差し替えた後の新しい内容がインデックスされ、順位は大きく下がってしまう。

これから作るファイルはまさに、インデックスされたことが確認できたら別のものに差し替えてしまうことを前提としている。これらのファイルが人目に触れることは想定しない。このため、拾ってきた文章をランダムに組み合わせたものをマークアップし、適切な場所に適切な回数だけキーワードを埋め込めば、それだけでファイルは完成する。文章になっている必要もなく、デザインも考える必要はない。

ファイルの生成は、FileMakerで作ったオリジナルの自動化ソフトを使う。キーワードのリストを読み込ませ、どの要素の中にどれくらいの割合でキーワードを埋め込むかを設定するだけで、あとは自動だ。あらかじめニュースサイトから適当にコピーしてきてDBに格納してある9,000行ほどの文をランダムに組み合わせてでたらめな文章を作成し、マークアップし、キーワードを挿入し、htmlファイルとして保存する。

今回はtitle要素を複数回記述するという特殊な条件が加わるため、ソフトを少し書き直す必要があったが、あとはそのままで使う。

キーワードは、ありきたりだが、女性の名前を使った。古今東西の女優やアイドル、モデル、女性アスリートや文化人などの名前およそ4,100名分を集めたファイルは、まさにスパマーの秘密兵器だ。このファイルを先の自動化ソフトに読み込ませれば、それぞれの名前に最適化されたファイルが自動で作られ、ローカルのフォルダに蓄積されていく。非力な旧型のPowerMacがうなりを上げた。

生成された総数4103に及ぶ膨大な数のファイルを Geocities と Tripod と EngelFire のサーバに分散してすべてアップロードし、それらの巡回申請を終えたたときには、すでに昼になっていた。あとはインデックス更新後のお楽しみだ。

ビンゴを引き当て栄光の日々。しかし…

あれからおよそ3ヶ月が経過した。春は過ぎ、梅雨も明け、夏も本番を迎えた。そんなある日の朝、俺はいつものようにアクセス解析の画面を開いた。JavaScriptでimgタグを呼び出すタイプの、あまり機能の多くないものだ。管理している数十万ページをすべて追うには、高機能なものは使えない。

アクセス解析の画面は、明らかな異変を告げいていた。Excite用に仕込んだページがインデックスに反映されたのだ。3時間ごとのアクセス数の推移を表すグラフは、直近の3時間のところで大きく跳ね上がっている。

はやる気持ちを抑えながらExcite Japanに接続し、検索を試みた。すべて女優の名前だ。1人、2人、3人、4人。17人目まで検索して、俺は検索する手を止めた。俺が作ったファイルはすべて1位表示だった。完璧だ。興奮も醒めないままに、俺は海外のスパマーが集まるチャットに入った。午前10時。アジアでは朝、アメリカは夜。

「PositionMonkey が発見した格好いいトリックは、Excite Japan でもビンゴを引き当てました。それを確認してください」

俺は検索結果へのリンクを3つほど貼った。最初に反応したのはシンガポール人だった。彼は北京語を使う。
「これは私にとっていい知らせです。まだExciteは中国語圏には進出していませんが、あなたの情報は将来私を助けるでしょう。あなたに感謝します」

似たようなレスは、東アジアのスパマーたちから続々と届いた。そして、このトリックを教えてくれた北米のスパマーからも。
「私の情報が遠い日本でも役に立ったことを、私は嬉しく思います。おめでとう!」

いつまでも勝利の美酒に酔っているわけにはいかない。俺は次の作業を開始した。上位に表示されているファイルを差し替え、金に換えなければならない。

まずはリダイレクト用のファイルを作る。転送先は、すでに高収益を上げている成人向けサイトだ。リダイレクトにはmetaタグのrefreshを使う。リダイレクトの際にはポップアップウインドウを開き、そこにも広告を表示するようにした。

いま上位に表示されているページを、この新しいファイルに差し替えれば、Exciteで女性名を検索して来たユーザーは、ポップアップ広告を見せられた上で成人向けサイトに誘導されるというわけだ。よく見かけるありきたりな仕掛けだが、それだけに収益性は抜群に高い。

その後の数ヶ月間、Excite Japan の成長と足並みを揃えるように、俺のスパムファイルたちが稼ぐアクセス数は順調に伸び続けていった。それに比例して収益も上がり続けた。US Exciteの経営上の問題が影響したのか、最終的に、次回のインデックス更新までは7ヶ月を要した。つまり、俺の4,000あまりのスパムファイルは、7ヶ月もの期間にわたって生き残り、収益を生み続けたのだ。

この間に女性名で検索して成人向けサイトに飛ばされた助平日本人の数は、延べ6,000,000人となった。俺にとってはちょっとしたボーナスだ。1つのトリックから始まった祭りは終わったが、トリックにも、得られた収益にも、俺は大いに満足した。


しかし、一つだけ不満なことがある。それは、あのときから今までの10年あまり、俺はずっと海外の最新情報を追い続けてきたが、こんなトリックはその後一度として登場していない、ということだ。それでも俺は、今日も海外の情報を漁る。夢よもう一度。

この記事について