Googleが説く検索の仕組み

Google検索は、こうなっている

検索における検索ワード。

検索クエリとも言われるこのワードに対応するページは、
ネット上に数万から数百万件もの膨大な数が存在する場合もあります。

そんな中、Google検索ではその結果をどのように表示しているのでしょうか。

実は、その作業は検索キーワードが入力される前から始まっています。

クロールとインデックス

GoogleではWebクローラといわれるWebを巡回して情報を集めるシステムを利用しています。

これによって、あらかじめ、
公開中のウェブページの情報を収集しているのです。

そして集めた情報をインデックスに登録、
ネット上の大まかな把握をここで行っています。

これらはすべてユーザーが検索する前の準備段階の話です。

クロールの流れ

では、クローラによるクロールの流れを見ていきましょう。

クロールの流れ① 概要

クローラがサイトを巡回し情報を集めることを「クロール」といいます。

まずは、過去のクロールから集められた情報と、
Webサイト所有者から提供されたサイトマップを使ってリストを構成するところから始まります。

そしてそのリスト使い実際にウェブサイトを巡回、
リンクを使って新しいページを探すのです。

このとき、新しいサイト情報や、
既存サイトの変更点、無効なリンクの有無を確認していきます。

クロールの流れ② Googleの姿勢

Googleは常に平等にクロールを行い、
有料でクロール頻度を増やすようなことはしていません。

また、サイトのクロール方法を所有者が細かく指定できるようなツールも提供していて、
サイト上のページを処理する方法を具体的に指定したり
再クロールや「robots.txt」をつかったクロールの停止もリクエストできます。

コレはすべて、ユーザーの検索の利便性を高めるためにおこなわれていることです。

インデックスの流れ

クローラが集めたサイト情報
Googleではそれをインデックス化して整理していきます。

インデックスの流れ① 総合的な収集

クローラによるウェブ・サイトの発見の後、
情報がインデックスされます。

しかしその内容は、大まかな内容ではなく、
書籍の巻末にある索引と同じようにGoogleのインデックスに登録された各ウェブページのすべてが登録されます。

そのインデックスの量、
なんと数千億のウェブサイトを1億ギガバイトを有に超える情報量で収集しているのです。

インデックスの流れ② 関連性の把握

現在Googleではナレッジグラフを採用してインデックスを充実させています。

ナレッジグラフとは単に語句を登録するのではなく、
その語句の意味を把握し、その関連性や関係性を把握し反映させる機能です。

これにより、キーワードから派生する検索者の動きや、
気になる場所、ひと、事柄を把握し続けているのです。

その結果Googleではあらゆる情報を体系的に整理。

地域の公共交通機関の移動時間から世界銀行で一般公開されているデータまで
検索することを可能としているのです。

検索アルゴリズムの仕組み

よりユーザー目線の検索。

そのために検索ランキングは常に進化する検索アルゴリズムによって構成されています。

検索キーワードを分析する

検索ワードをただ単にごくとして検索するようでは、
ユーザー目線とは言えません。

単語の意味をしっかり把握し、
関連性の高い単語をインデックスで検索するために言語モデルを構築しているのです。

その中で、類義語システムや検索がもたらすユーザーの検索糸などをアルゴリズムの分析によって把握、
その検索の目的にまで迫るワードの分析を行っているのです。

検索キーワードの照合

次に、検索ワードに一致するWebサイトを探します。

キーワードを、タイトルや見出し本文中に見つけ出して分析、
より適切なサイトを探し出すのです。

このとき『キーワードがたくさん含まれているページであればいい』
というものではありません。

検索ワードに対する答えが存在することが一番の重要な項目ですので、
検索ワードに合致する関連の項目、動画や画像、
リストなどが含まれているかを総合的に判断していきます。

有益なページをランキング

アルゴリズムは、見つけ出したサイトを様々な観点でランキングします。

コンテンツの新しさ、検索キーワードの頻出度、ユーザーエクスペリエンスの質、
など多種多様な要因を評価の基準とします。

また検索ワードに対する有益度として、信頼性や権威も大切。

検索ワードに対応する他の著名なサイトからのリンクやユーザーからの評価も大きなポイントです。

文脈を考慮する

アルゴリズムは検索結果を検索者のデータから文脈を読んで表示します。

それは場所や検索履歴から導き出されるもので、
頻繁に野球を検索するひとでそこが関西なら、
虎として検索される言葉は、当然阪神タイガース優先になるというわけです。

ただし、検索結果に履歴を反映させるか否かはユーザー自身で設定が可能です。

最適な検索結果を返す

様々な観点でアルゴリズムによる分析が終われば、検索結果が表示されます。

さいごに、関連情報の整合性、つまり、
検索結果に共通する話題の数や解釈の偏りなども加味して検索結果を表示するのです。

こうして、検索ワードに対して、
より高品質な検索結果を導き出しているというわけです。

進化し続けるGoogle検索

グーグル検索は1998年にサービスを開始して以来、度重なる改良を加えてきています。

また、様々なサービスを提供することで、
今や検索といえばGoogleという地位にまで上り詰めているのです。

それこそ2016年だけでなんと1600件の改良をくわえているというのですから、
その進化はすさまじく、よりユーザビリティの高い検索エンジンとして人間に最適化。

よって、コレまでのように、
キーワードをやたら配置したり意味のないリンクを引っ張ってくるなどということは、
検索結果に反映されにくくなるのです。

しかもGoogle検索はこれからも進化を止めることはないでしょう。

つまり、この先に見えるのは『本質的に価値のあるサイト』ということになるのです。

ITツールを使って集客する方法を講座でお伝えしています。

「起業家へ贈るITツール活用セミナー」プログラム

ネット集客の第一歩

この講座で<あなたのビジネス>が加速します。