グーグルの公式見解。リンクは重要

「Googleについて」 ページランクPageRankTMはグーグルの商標登録です。
(別ウィンドウ)

Google の人気の秘密 ページランク

「Google の人気の秘密」から抜粋(別ウィンドウ)
PageRankTM は、Webの膨大なリンク構造を用いて、その特性を生かします。ページAからページBへのリ ンクをページAによるページBへの支持投票とみなし、Googleはこの投票数によりそのページの重要性を判 断します。しかしGoogleは単に票数、つまりリンク数を見るだけではなく、票を投じたページについても 分析します。「重要度」の高いページによって投じられた票はより高く評価されて、それを受け取ったペ ージを「重要なもの」にしていくのです。
こうした分析によって高評価を得た重要なページには高いPageRankTM(ページ順位)が与えられ、検索結 果内の順位も高くなります。PageRankTM はGoogleにおけるページの重要度を示す総合的な指標であり、各検索に影響されるものではありません。むしろ、PageRankTM は複雑なアルゴリズムにしたがったリンク構造の分析にもとづく、各Webページそのものの特性です。
Google はページ内での各キーワードの位置も重視します。
Google の結果は、ユーザーが指定したすべてのキーワードを含むだけではなく、そのページ内でそれらの キーワード間の近接度も分析します。他の多くのサーチ エンジンとは異なり、Google ではキーワードの近接度に従って検索結果の順位付けを行います。キーワードが近くに一緒にまとまっている検索結果ほど優先されるので、関係のない結果を排除する手間を省くことができます。

ウェブマスターのためのガイドライン

ウェブマスターのためのガイドライン
「ウェブマスターのためのガイドライン」から抜粋
(別ウィンドウ)

デザインおよびコンテンツに関するガイドライン

わかりやすい階層とテキストリンクを持つサイト構造にする。各ページへは、少なくとも 1 つの静的なテキストリンクからアクセスできるようにします。情報量が豊富で便利なサイトを作成し、コンテンツをわかりやすく正確に記述する。ユーザーがサイトを探すときに入力する可能性の高いキーワードをサイトに含める。重要な名前、コンテンツ、またはリンクを表示するときは、画像の代わりにテキストを使用する。Google のクローラでは、画像に含まれたテキストは認識されません。TITLEタグおよびALT タグの説明をわかりやすく正確なものにする。
無効なリンクがないかどうか確認し、HTML を修正する。
動的なページ(URL に "?" が含まれているページなど)を使用する場合、検索エンジンのスパイダーによ っては、静的なページと同じ様にはクロールされない場合があることを考慮する。パラメータを短くした り、数を少なくすると、クローラで見つけやすくなります。

技術関連のガイドライン

テキストブラウザで、Javascript、cookie、セッションID、フレーム、DHTML、Flash などの特殊な機能を使用して作成されたサイトの一部が表示されない場合は、検索エンジンスパイダーがサイトをクロールするときに問題が発生する可能性があります。
セッションIDやサイト内のパスを追跡する引数がなくても、検索ロボットがサイトをクロールできるようにする。これらのテクニックは個々のユーザーの動きを追跡する場合に便利ですが、ロボットがアクセスするパターンとはまったく異なります。これらのテクニックを使用すると、一見異なっているようで実際は同じページにリンクしているURLをロボットが排除できず、そのサイトのインデックスが不完全なも のになる可能性があります。
URLで&idパラメータを使用しない。このパラメータを含むページは Googleのインデックスに登録されません。

Open Directory プロジェクト、Yahoo!、およびその他の業界専門サイトなどの、適切なディレクトリにサイトを登録する。

品質に関するガイドライン - 基本方針

検索エンジンではなく、ユーザーの利便性を考慮してページを作成する。 ユーザーを騙すようなコンテンツや、"クローキング"を行って検索エンジン用に異なるコンテンツを表示しないでください。
検索エンジンでの掲載位置を上げるための不正行為を行わない。判断の目安となるのは、ランクを競っているサイトに対して自分が行った対策を説明したときに、何もやましい点がないかどうかです。その他にも、ユーザーにとって役立つかどうか、検索エンジンがなくても同じことをするかどうか、などのポイントを確認してみてください。
サイトの掲載位置や PageRankを上げるためのリンクプログラムに参加しない。特にウェブ スパマーや不正なウェブ サイトへのリンクは行わないでください。これらのリンクにより、サイトのランクが下がることがあります。
不正なコンピュータ プログラムを使用して、ページの登録やランクの確認を行わない。 このようなプログラムの使用はコンピュータのリソースを消費し、Google の利用規約に違反します。

品質に関するガイドライン - 推奨

隠しテキストや隠しリンクを使用しない。
クローキングや不正なリダイレクトを行わない。
コンテンツに関係のない言葉をページに記載しない。
複数のページ、サブドメイン、ドメインで同じコンテンツを公開しない。
検索エンジン用に誘導ページを作成したり、オリジナルのコンテンツがほとんどない提携プログラムのような見掛け倒しのプログラムを使用しない。

Google 会社情報: テクノロジー

「Google 会社情報: テクノロジー」から抜粋

Google のテクノロジー

Google の検索テクノロジーを支えているのは、一連の計算を数分の一秒で同時に行うソフトウェアです。
従来型の検索エンジンは、単語が 1 つのウェブ ページに何回出てくるかに重点を置いています。
Google の PageRank? テクノロジーはウェブのリンク構造全体を調べ、どのページが最も重要かを判断します。
その後、ハイパーテキスト一致分析を通じて、現在行っている検索に関連のあるページを特定します。
Google は、全体の重要度と検索クエリとの関連性を組み合わせ、最も関連性の高い、信頼の置ける結果を提供しているのです。

ページランク PageRankテクノロジー

PageRankは、5 億の変数と 30 億以上の用語の等式を解決することでウェブ ページの重要度を客観的に測定します。
PageRankは、リンク数を数えるのではなく、ページ A からページ B へのリンクを、ページ A によるページ B への投票として解釈します。
ページの重要度は、ページが受けた投票数によって決まります。
PageRankでは、投票したページの重要度も考慮されます。
重要度が高いページからリンクされたページも重要度が上がります。
重要なページは PageRankが高くなり、検索結果の上位に表示されます。
Google のテクノロジーは、ウェブ上に蓄積された情報を使用してページの重要度を決定します。
検索結果にまったく人の手が加わらないことが、有料広告などに左右されない客観的な情報源としてユーザーの皆様から信頼を受けている理由です。

ハイパーテキスト一致分析

Google の検索エンジンは、ページのコンテンツも分析します。
といっても、各ページのテキストを単にスキャンするのではなく
(この方法はサイトの運営者によってメタ タグで操作される可能性があります)、
ページのコンテンツ全体と要素をフォント、分割構造、および各単語の厳密な位置という観点から分析するのです。
Google は、隣接するウェブ ページのコンテンツも分析し、ユーザーの検索クエリに最も関連する結果を確実に提供できるようにしています。

最後まで読んでいただいて、ありがとうございました。