huruyosi’s blog

プログラミングとかインフラとかのメモです。

lucene

lucene の インデックスを確認する

前回の記事でインデックスを作成したものの、意図した通りに作成できているのかを確認することができません。 使うツール Luke (http://luke.googlecode.com/svn/)があります。しかし、4.xに対応していないので、対応したものが GitHub にあがっています。 t…

Apache lucene で名寄せを実現する その三 luceneのインデックスを構築する

プロジェクトができたので、既存システムの商品マスタを投入してluceneのインデックスを構築します。 データ投入 テーブル作成 evolutionを利用してテーブルを作成します。作成するテーブルは既存システムの商品マスタです。 # --- !Ups drop table if exist…

Apache lucene で名寄せを実現する その一

やりたいこと システムを新しくするにあたり、商品のマスタデータを整理することになりました。複数の店舗で別々に管理しているので本来であれば同じ商品が別々に登録され、名称も一致していません。 各店舗のデータを集めてきて商品マスタとして一本化する…