検索結果を簡潔に表示するため、同一ドメイン・サブドメインのWebページをグループ化してインデント表示するクラスタリングについて説明します。

同一ドメイン・サブドメインのWebページをグループ化

検索結果のクラスタリング表示とは、検索結果を簡潔に表示するため、同一ドメイン・サブドメインのWebページをグループ化し、インデントする表示方式のことです。例えば、Googleでは、1つのドメイン・サブドメイン内に属するWebページを同じ検索結果ページ内に複数出現するような場合、それらを2つまたは3つにまとめ、2つめ以降を折り畳んでインデント表示します。

一例として、Googleで「NTT東日本 + フレッツ光」と検索してみましょう。flets.com 内のWebページが複数表示され、2つめ以降がインデント表示(右に一段ずれて表示)されているはずです。その下には「+ flets.com のその他の検索結果を表示する」というテキストリンクが表示されていると思います。そのリンクを進むと、検索結果に表示されていなかった flets.com 内に含まれるWebページの一覧表示に進みます。

これは、実際には数多くヒットしていたと思われる flets.com 内のページの中で、最もスコアリング値の高いWebページと、その次にスコアリング値の高いWebページだけを表示し、その他のものを折り畳んで表示=クラスタリングしていたということがわかります。

幅広い情報ソースからの検索結果を一画面に表示

この処理によって、限られた検索結果画面を単一のサイトからの検索結果で埋め尽くすことなく、幅広いソースからの検索結果を提示することが可能になります。先の例では、クラスタリングを行わず、本来のランキングのまま表示していれば、検索結果の最初のページに flets.com 内のWebページ が複数並ぶことになったでしょう。

1つのドメイン・サブドメイン=1つのWebサイトと考えたとき、同じような内容が含まれているであろう同一サイトのURIが多く並んでしまうと、ユーザーにとっては他の有用なWebサイトを見つけることが困難になります。検索エンジンはそのようなユーザーの負担を減らし、様々なソースからの情報を検索結果に表示するために、クラスタリングを行っています。

無料ブログスペースやショッピングモールは注意

同じドメイン・サブドメイン内のページがクラスタリングされるということは、サービスプロバイダ内のホームページエリアや、ディレクトリ単位でユーザースペースが割り当てられる無料ブログ、無料サーバ、ショッピングモール内などに設置されるWebサイトにとっては大きな問題です。

それらのWebサイトは、他のWebサイトと同じドメイン・サブドメインを持つサーバーの、1ディレクトリに設置されます。そのため、検索エンジンに、複数のWebサイトが同じWebサイトの個々のページだとみなされ、キーワードへの適合度の高い2・3のページを除いて全てクラスタリングされてしまうのです。

Webサイトを制作する際に、それが必ず検索されなければならないものである場合、独自のドメインの取得は欠かせないものであるといえます。