最近、アイティメディア株式会社が運営する複数のサイトにおいて、SEOの観点から非常に残念な事態が起こっています。大量に存在する隠しテキストなどが原因で、相当数のページがGoogleのペナルティを受けているのです。この記事では、この問題をひっそりと共有したいと思います。なおこの記事は公開日である2012年7月22日時点での情報に基づいています。

このページの内容は執筆時のもので、すでに古くなっています。現在は大半の問題は修正されているようです。

1. 問題発覚の端緒「ITmedia マーケティング」というサイト

この「ITmedia マーケティング」というサイトは、つい先日である2012年7月17日に開設されたばかりであり、運営元のアイティメディア株式会社のプレスリリースによれば「テクノロジーを軸としたマーケティングの最新情報を提供するWebメディア」であるそうです。

このサイト内のいくつかの記事には、「続きを読むには会員登録(無料)が必要です」と表示されて続きが非表示になる仕組みが実装されていますが、この実装方法に問題があるということが、Facebook上で辻正浩さんによって去る2012年7月17日に指摘されました。

そのとき指摘の例として取り上げられたページは第1回 CMOが日本の組織に馴染まない理由 (2/3)というもので、辻さんはこのページの実装上の問題にまでは言及していませんでした(知人のみに公開のFacebook上でのことですので、こんな初歩的なことをわざわざ説明する必要はないためです)が、念のために再確認しておくと、ここで問題になっているのは隠しテキストです。

より具体的には、ページネーションの2ページ目にあたるこのページは、実際には記事が書かれているにもかかわらず、非ログイン状態のユーザーにはその記事を覆うようにCSSレイヤーが被せられおり、「人間のユーザーには見えないが、検索エンジンのロボットには見える」状態になっています。これはGoogleガイドライン「隠しテキストと隠しリンク」における「ユーザーに対するものと異なる情報が検索エンジンに提示される」に該当すると考えられます。

しかし辻氏が問題を指摘した時点では、Googleによるペナルティを受けていることは確認できませんでした。ところがその数日後、昨日(2012年7月21日)に筆者が調査してみたところ、一部のページでペナルティとみられる現象が確認され、同時に、検索結果には当該サブドメイン(marketing.itmedia.co.jp)はほとんど表示されない状態になっていることが確認できました。

2. 大半のページが検索結果に表示されない現状とその理由

現状、ITmedia マーケティングにアクセスし、そこにある各記事のタイトル文字列をそのまま使って、GoogleやYahoo!(この種の調査の時にはYahoo!がおすすめです)で検索してみると、ほとんどすべての記事について、ドメイン「marketing.itmedia.co.jp」内のものは表示されません。代わりに表示されるのは、

  • www.itmedia.co.jpのような、同社運営の別のサブドメイン上で公開されている同一内容のページ
  • その記事を引用または紹介しただけの無関係なサイト上のページ

のようになっています。前者は単純な重複コンテンツの問題ですので、そう大きな問題ではありません。同社が提供する記事は、サブドメインで分けられた多数のサイトに重複して掲載されるため、それらの重複コンテンツの中からGoogleが代表するコンテンツであると判断した別のページが上位に表示されている、という状態です。しかもGoogleの判断も適切に行われているように見えます。

しかし問題は後者です。これは極めて初歩的なGoogleガイドライン違反である「隠しテキスト」が使用されていることに起因するものと考えられ、「テクノロジーを軸としたマーケティングの最新情報を提供するWebメディア」を謳う同サイトとしては、見識を疑われても仕方のないミスであると言わざるを得ません。

先述したように、これは「続きを読むには会員登録(無料)が必要です」の仕組みの実装方法に問題があるわけですから、問題のある現状のJavaScriptとCSSを使用したものからサーバサイドスクリプトを使用するものへと変更するだけで済むことですし、アイティメディアさんは早急に改善を図るべきかと思います。

3. ページネーションの2ページ目以降の影響で1ページ目にペナルティ

純粋な興味から今回のケースをさらに見ていくと、おもしろいことに気付きます。隠しテキストはページネーションの2ページ目以降にだけ使われているにもかかわらず、1ページ目もペナルティを受けているように見える、という点です。次の2つのリンクは、それぞれのアンカーテキストと同じ文字列でYahoo検索した結果にリンクしています。

これらはいずれも、2ページ目以降に隠しテキストが使われている記事のタイトル文字列を使った検索ですが、隠しテキストがないはずの1ページ目も検索結果に表示されません。当該の記事のページのソースにはページネーションを指示するlinkタグ(rel="next" や rel="prev")は入っていませんから、Googleはページ分割を自動で適切に処理した上で、ペナルティまで与えていると考えられます。

なお、ここで例に示した記事は以下の2記事です。

4. 調査の過程で発見したさらにすごいサイト

調査の過程でitmedia.co.jp内の各サイトを見ていると、同様の問題を抱えた記事は多数見つかりました。しかし本当に驚かされたのは、TechTargetジャパンでした。このサイトでは驚くべきことに、ほとんどすべての記事ページに大量の隠しテキストが存在し、ほとんどすべての記事において、記事タイトルそのままの文字列で検索しても当該記事はヒットしない(GoogleにBanされている)という状況に陥っています。

このTechTargetジャパンはTechTargetジャパンとはのページにある情報によれば「企業内の情報システムに関与するキーパーソンを対象に、IT製品/サービスの導入・購買を支援する情報を提供する会員制メディアです」(強調は筆者)とあり、会員制という位置づけであるようですので、サーチからのトラフィックは運営上重視していないのかもしれません。

とはいえ、サーチからのトラフィックを重視しないのであれば記事は完全に非公開でよいはずで、人間のユーザーにも検索エンジンのロボットにも何も見せる必要はありません。しかし実際は、検索エンジンはすべての情報を取得できるようになっています。人間のユーザーには見えないようにしてあるにもかかわらず、です。

こうなると、この実装はサーチを欺く意図があったと判断されても無理もありません。少なくとも、繰り返しの引用になりますが、Googleガイドライン「隠しテキストと隠しリンク」における「ユーザーに対するものと異なる情報が検索エンジンに提示される」に該当するのは明らかです。

5. なぜこのような事態が起きてしまったのか

これらのサイト群の運営元であるアイティメディア株式会社は、マザーズに上場(2148)しており、ソフトバンク メディアマーケティング ホールディングス株式会社やヤフー株式会社が主要株主とないっているソフトバンクグループ傘下の有力企業です。普通に考えて、このような会社のサイトが検索エンジンを欺いてトラフィックを盗もうと企図するとは思えません。意図的なものではなくミスでしょう。

ではなぜこのようなミスが起きたか。理由は大きく分けて3点あります。

まず第1に、SEOや検索に関する知識不足が挙げられるでしょう。これだけ大きな企業の、これだけ大きなメディアですから、社内にSEO担当者を置いておくか、最低でも外部にアドバイザーは持っておくべきです。もしそのような担当者がすでにいた上でこの有様なら、その担当者の権限は明らかに小さすぎます。

第2に、一般的でない実装で会員向けと非会員向けの情報の区別したこと。今回のケースの問題点は「続きを読むには会員登録(無料)が必要です」の仕組みの実装方法にあるわけですが、特にSEOや検索に関する知識がなかったとしても、他のサイトでよく見られるような一般的な方法で実装していれば、問題は発生しませんでした。わざわざ一般的でない実装を選択し、問題を発生させています。

第3に、(おそらく)Googleウェブマスターツールを使用していないこと。筆者の想像に過ぎませんが、おそらくこの一連のサイト群ではGoogleウェブマスターツールを使用していないでしょう。使用していれば、何らかの警告が届き、それによって早期に問題を把握できていたはずです。

いずれも、なぜ避けられなかったのか疑問なほどに初歩的なことであり、おそらくは、船頭の多い巨大メディアだからこそ起こったことなのでしょう。このケースを他のサイトにあてはめて教訓とするのは難しいものがありますが、一般のサイトにおいては、せめて最低限、次のようなことには気をつけておくべきかと思います。

あとはまあ、もし余力があれば辻正浩さんにコンサル契約をお願いするのもいいかもしれません。