SEOってなに? 2

以下は、自分の理解のための拾い読み(全部訳ではない)で、内容の要約(サマリーや一部翻訳)及び私のコメント(下線)が混在する。

The anatomy of a large-scale hypertextual Web search engine. (大規模ハイパーテキストであるウエブの検索エンジンの解剖)

Abstract

  • Hypertext : コンピュータを利用した文書作成・閲覧システムの一つ。文書内の任意の位置や要素に、他の文書への参照(所在情報や識別情報)を埋め込み、複数の文書を相互に結びつけたもの。
  • Web : インターネット上で標準的に用いられている、文書の公開・閲覧システム。
  • Search engine: Webページや画像、動画、文書ファイルなどを対象に、ソフトウェアによって自動的に様々なサイトのデータを収集して索引付けし、様々な条件で検索できるようにしたインターネット上のサービス。
  • Google : googol(グーゴル)[ 10の100乗 と言う厖大な数 ]に由来する造語。

大規模サーチエンジンのプロトタイプとして、Googleを論文の最初に紹介している。Google の特徴は、web上から情報をかき集め(crawl)、その情報に効率良く索引を付け(index)、より満足にいく検索結果を提示する。実際のところ、スタンフォード大学のネット環境には、24million pageのデータ・ベースを構築して検証した様である。

*1.  Introduction

– 表示せず –

 

 *1.1.  Web search engine – sealing up: 1994-2000

それまでの検索エンジンの特徴/問題点を説明。

さらに、彼らが目指すシステムのゴールは、品質と拡張性の両方において、現存の問題の多くに対応し、検索エンジン技術を桁外れの規模数を目指して高める、と宣言している。

*1.2  Google: scaling with the web

サクサクとWeb上をアクセスする技術、得た情勢を常に把握している事。ドキュメント自体をインデックス化して効率良く、適正に保存。インデックス化は何百ギガバイトのデータを扱う。Query(検索の質問)は1秒間に何百から何千のレベルで処理。

Webの成長に伴いこれらの条件は厳しくなるが、一方ではハードウェアの進化によるパフォーマンス向上でカバーできる。

参照資料 :

  • The anatomy of a large-scale hypertextual Web search engine. Stanford University Sergey Btin、Lawrence Page   (発表に際してFull versionと配布用のShorter versionが用意されていた様だ。)