namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Namazuでのフィールド検索について



ご意見、ありがとうございました。

早速調査してみます。
データをNamazu用にフィールドごとに分割したものを用意して、
(フィールド検索できないため)

 ・分割ファイルに対してNamazuを適用、
 ・分割する前のファイルに対してサファリを適用、

で、インデックス作成時間、検索速度の性能比較を同一マシン上で
やってみます。

ただ、Namazuではできないのでしょうか。
 ・Namazuが向いていること、
 ・向いていないこと
を教えていただけないでしょうか。

お願いします。

> ファストスタジオ廣瀬ともうします。
>
> > From "Tadashi Kanbayashi" <Tadashi.Kanbayashi@xxxxxxxxxxxx>
> > Subject: [namazu 1279] Namazuでのフィールド検索について
>
> > 現在、データをSGML風のフルタグ形式
> > の1つのファイルで管理しています(約30M)。
> >
> > で、このデータに対して、タグを指定する
> > ことで任意のフィールド検索を実施し、
> > さらに、その結果、検索文字列(条件)
> > が含まれる指定したタグで囲まれる文書
> > すべてを抽出することを検討しています。
>
> Namazuではなくて、SUFARY <http://cl.aist-nara.ac.jp/lab/nlt/ss/>
> を使う方が幸せになれそうです。
> #SUFARYのPerl Moduleをつかえば、簡単にできそう。
>
> http://cl.aist-nara.ac.jp/lab/nlt/ss/doc/intro.html
> から引用
>
>  SUFARY とは suffix arrayというデータ構造を用いて高速な文字列
>  検索を行なうためのライブラリを中心としたパッケージです。
>
> 得意なもの = 一つのファイルに対するキーワード検索
>      辞書・住所録・新聞一年分データなどの、巨大な単一ファイルに
>      対する文字列検索。
>
> 苦手なもの
>      複数ファイルに対する検索
>          電子メールのような多数のファイルに対する検索。
>      ファイルが手元にない状態での検索
>          WWWページの検索。
>