2008年08月16日

全文検索エンジンとは

◆全文検索エンジンとは
全文検索エンジンとは、膨大なデータの中から欲しい情報を取得するための検索システムの、エンジン部分にあたります。

検索システムは、検索するためのデータを用意する裏方の処理と、
検索したいキーワードで、必要な情報を取得し、ユーザーに返す
表側の処理の2系統で成り立っており、概要は下記の通りです。

[☆バックエンド(裏方)]
1.データ収集[crawl]
  ↓
2.Index(索引)作成[indexing]
  ↓
【Indexデータ】

[☆フロント(表)]
3.検索リクエスト
  ↓
4.【Indexデータ】に問い合わせ
  ↓
5.結果を返す

上記の必要な処理の中で、Luceneで提供されていない機能に
関しても、Luceneの開発を行っているApacheのサブプロジェクトで
開発されているものもある。
例えば、
crawler:Nutch
Webで検索リクエスト処理と結果を返すアプリケーションのフレームワーク:Solr

上記についても随時情報を追記していく予定。
posted by Lucene勉強中 at 04:11| Comment(0) | 基礎知識 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。


×

この広告は1年以上新しい記事の投稿がないブログに表示されております。