こんにちは、だいきです。
今回は、毎日のように使われている検索エンジンがどのように構築されているのかについて説明していこうと思います。
検索エンジンとは、文書の集合から、調べたい情報に一致する文書を見つけ出すシステムのことを言います。
日本で最も使われている検索エンジンは、Googleの検索エンジンです。では検索エンジンは、どのようにできているのでしょうか。
基本的に、検索エンジンは4つの要素で構成されています。
です。
インデックスマネージャーは、検索を高速化するために「インデックス」と呼ばれるデータを管理するものです。
インデックスサーチャーは、「インデックス」を用いて全文検索を行うものです。
ユーザーから検索したワードを受け取り、そのワードにヒットした文書を引き出すことを行なっております。
インデックサーは、文書からインデックスを作るものです。
具体的には、テキスト文書を単語に分解して、インデックスを作っていきます。
ドキュメントマネージャーは、検索対象の文書を蓄えておくデータベースを管理するものです。
以上の4つの要素で、検索エンジンは構築されています。
以上、だいきでした。