SEOってなに? 4

*2.  System feature

Googleサーチエンジンには、二つの重要な特徴がある。

  • Webのリンク構造(link structure)の使用。各々のWebページの品質ランキング(quality ranking)を計算する。(PageRank)
  • リンクを利用して検索結果を向上させる。

*2.1.  PageRank : bringing order to the Web   (Webに秩序をもたらす)

Webの引用(リンク)図式は、現存するWebサーチエンジンには大規模には使用されてこなかったが、重要な方法(resource)である。我々はWeb全体の統計的に意味のあるサンプル、518 x 100万におよぶハイパーリンクを含むマップを構築した。これらのマップでWebページのPageRank計算を迅速に行えた、PageRankと言う機能は人々が重要であると何となく感じている事と一致する引用(リンク)の重要度を客観的に測定する。この一致性のゆえに、PageRankはWebのキーワード検索の結果を重要度順にランク付けする卓越した方法である。

もっとも身近な対象について、Webページタイトルに限定される単純マッチング検索は、PageRankが(検索の)結果を順位付けする時、見事に機能する。Googleシステムのメイン機能である全文検索(full text sketch)において、PageRankはもちろん大いに機能する。

ちなみに、PageRankの処理は特許が取得されている。ただし、特許はGoogleではなくスタンフォード大学に帰属しており、Googleはスタンフォード大学から同特許の権利を独占的にライセンスされている、との事です。

*2.1.1.  Description of PageRank calculation

学術論文の引用文献の仕方は、主に引用数を数えたり、特定のページにリンクされたりしてWebに応用されてきた。この方法はページの重要度や品質についてなんらかの見積もりを与える。PageRankは全てのページからのリンクを等分にカウントするのではなく、一つのページにリンクする数によって正規化(normalize  ページの重要度に重み付けをする)する事で、このアイデアを発展させた。

PR(A)以下の式はよく分からない。また、d=0.85 の意味合いも理解していない。

参照資料 :

  • The anatomy of a large-scale hypertextual Web search engine. Stanford University Sergey Btin、Lawrence Page (発表に際してFull versionと配布用のShorter versionが用意されていた様だ。)