2008年08月15日

Luceneとは・・・

◆Luceneとは
Javaで書かれた、全文検索エンジンライブラリ。
Apacheプロジェクトで開発が進められている。

Luceneとは何かを理解するうえで、全文検索の仕組みについても
前提知識が必要なため、その辺については「※全文検索エンジンとは」に記載。

Lucene自体は検索機能を提供するのみなので、アプリケーションの
作成には、他にもいくつか必要。
例えば日本語の検索をするには、CJKAnalyzerかJapaneseAnalyzerを使って
日本語のインデキシングを行う必要がある。
また、データの収集を行うクローラには、Apacheのサブプロジェクトで
Nutchと
いうのがあり、ウェブアプリ用にはSolrというのがある。

○Lucene公式サイト
http://lucene.apache.org/

○Solr公式サイト
http://lucene.apache.org/solr/

○Nutch公式サイト
http://lucene.apache.org/nutch/

◆キーワードMEMO
※全文検索エンジン
※インデキシング[indexing]
※CJKAnalyzer
※JapaneseAnalyzer
※Nutch
※Solr
ラベル:lucene
posted by Lucene勉強中 at 02:48| Comment(0) | 基礎知識 | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。

広告


この広告は60日以上更新がないブログに表示がされております。

以下のいずれかの方法で非表示にすることが可能です。

・記事の投稿、編集をおこなう
・マイブログの【設定】 > 【広告設定】 より、「60日間更新が無い場合」 の 「広告を表示しない」にチェックを入れて保存する。


×

この広告は1年以上新しい記事の投稿がないブログに表示されております。