検索エンジンは特別な辞書を持っている

検索エンジンは、特別な辞書に載っている単語で文章を区切っていく。高校生のための HPアクセスアップ、検索上位HIT術メルマガ-082。

ヤフー検索という記述があるので、この記事は2010年以前のものです。しかし、2021年の今でも、検索エンジンは、特別な辞書を使って、日本語の文章を単語に区切っています。形態要素解析と言います。

グーグルとヤフーの検索結果の違い

グーグル検索では「高校生のキス」と「高校生のキッス」の検索結果はほとんど同じ。ヤフー検索では「高校生のキス」と「高校生のキッス」の検索結果は違う。

Googleの辞書では「キス」と「キッス」は同じ「キス」。Yahooの辞書では「キス」と「キッス」は別の言葉と解釈されるようです。

グーグルとヤフーの持っている辞書が違うから

http://www.su-jine.com/sujine_seo_words.phpへ行くと辞書に何が登録されているか、分かります。最近はうまく機能してないようですが。

ボックスに「埼玉県」を入れて、チェックボタンを押す。Googleの辞書には「埼玉県」が登録されていて、Yahooの辞書には「埼玉」と「県」が別々に登録されているみたいです。

Yahooの辞書では「短大卒」は「短」と「大卒」に分解されるようです。短大に関するページでは「短大 卒」と書いた方が良いでしょう。

検索エンジンの辞書の現在と未来

検索エンジンの辞書の現在

「バイオリン」と「ヴァイオリン」は、一般的な検索エンジンは、同じと解釈するようです。「教師」と「先生」は、一般的な検索エンジンは、全く違うと解釈するようです。

検索エンジンの辞書の未来

「教師」と「先生」は普通の人間にとって、ほとんど同じ意味だが、微妙に違う所もある。で、近い将来、すぐれた検索エンジンは、「関連度係数」などというのを導入するのでは。 「教師」と「先生」の「関連度係数」は0.9。「教師」と「せんこう」の「関連度係数」は0.7。「恩師」と「先生」の「関連度係数」は0.7。なんてね。

検索エンジンは進歩する

とにかく、ユーザーの利便性を考えて、検索エンジンは日々進歩する。進歩しないと、淘汰される。だから、現在の上位ヒットの為の小細工は1年もすれば、通用しなくなるかも。で、リニューアルする事にしました。

最後まで読んでいただいて、ありがとうございました。