namazu-ml(ring)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Namazuでのフィールド検索について
ご意見、ありがとうございました。
早速調査してみます。
データをNamazu用にフィールドごとに分割したものを用意して、
(フィールド検索できないため)
・分割ファイルに対してNamazuを適用、
・分割する前のファイルに対してサファリを適用、
で、インデックス作成時間、検索速度の性能比較を同一マシン上で
やってみます。
ただ、Namazuではできないのでしょうか。
・Namazuが向いていること、
・向いていないこと
を教えていただけないでしょうか。
お願いします。
> ファストスタジオ廣瀬ともうします。
>
> > From "Tadashi Kanbayashi" <Tadashi.Kanbayashi@xxxxxxxxxxxx>
> > Subject: [namazu 1279] Namazuでのフィールド検索について
>
> > 現在、データをSGML風のフルタグ形式
> > の1つのファイルで管理しています(約30M)。
> >
> > で、このデータに対して、タグを指定する
> > ことで任意のフィールド検索を実施し、
> > さらに、その結果、検索文字列(条件)
> > が含まれる指定したタグで囲まれる文書
> > すべてを抽出することを検討しています。
>
> Namazuではなくて、SUFARY <http://cl.aist-nara.ac.jp/lab/nlt/ss/>
> を使う方が幸せになれそうです。
> #SUFARYのPerl Moduleをつかえば、簡単にできそう。
>
> http://cl.aist-nara.ac.jp/lab/nlt/ss/doc/intro.html
> から引用
>
> SUFARY とは suffix arrayというデータ構造を用いて高速な文字列
> 検索を行なうためのライブラリを中心としたパッケージです。
>
> 得意なもの = 一つのファイルに対するキーワード検索
> 辞書・住所録・新聞一年分データなどの、巨大な単一ファイルに
> 対する文字列検索。
>
> 苦手なもの
> 複数ファイルに対する検索
> 電子メールのような多数のファイルに対する検索。
> ファイルが手元にない状態での検索
> WWWページの検索。
>