namazu-ml(ring)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Namazuでのフィールド検索について
ファストスタジオ廣瀬ともうします。
> From "Tadashi Kanbayashi" <Tadashi.Kanbayashi@xxxxxxxxxxxx>
> Subject: [namazu 1279] Namazuでのフィールド検索について
> 現在、データをSGML風のフルタグ形式
> の1つのファイルで管理しています(約30M)。
>
> で、このデータに対して、タグを指定する
> ことで任意のフィールド検索を実施し、
> さらに、その結果、検索文字列(条件)
> が含まれる指定したタグで囲まれる文書
> すべてを抽出することを検討しています。
Namazuではなくて、SUFARY <http://cl.aist-nara.ac.jp/lab/nlt/ss/>
を使う方が幸せになれそうです。
#SUFARYのPerl Moduleをつかえば、簡単にできそう。
http://cl.aist-nara.ac.jp/lab/nlt/ss/doc/intro.html
から引用
SUFARY とは suffix arrayというデータ構造を用いて高速な文字列
検索を行なうためのライブラリを中心としたパッケージです。
得意なもの = 一つのファイルに対するキーワード検索
辞書・住所録・新聞一年分データなどの、巨大な単一ファイルに
対する文字列検索。
苦手なもの
複数ファイルに対する検索
電子メールのような多数のファイルに対する検索。
ファイルが手元にない状態での検索
WWWページの検索。
-----------------------------
yoshihide hirose
mailto:yoshihide@xxxxxxxxxx
-----------------------------