namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Namazuでのフィールド検索について



ファストスタジオ廣瀬ともうします。

> From "Tadashi Kanbayashi" <Tadashi.Kanbayashi@xxxxxxxxxxxx>
> Subject: [namazu 1279] Namazuでのフィールド検索について

> 現在、データをSGML風のフルタグ形式
> の1つのファイルで管理しています(約30M)。
> 
> で、このデータに対して、タグを指定する
> ことで任意のフィールド検索を実施し、
> さらに、その結果、検索文字列(条件)
> が含まれる指定したタグで囲まれる文書
> すべてを抽出することを検討しています。

Namazuではなくて、SUFARY <http://cl.aist-nara.ac.jp/lab/nlt/ss/>
を使う方が幸せになれそうです。 
#SUFARYのPerl Moduleをつかえば、簡単にできそう。

http://cl.aist-nara.ac.jp/lab/nlt/ss/doc/intro.html
から引用

 SUFARY とは suffix arrayというデータ構造を用いて高速な文字列 
 検索を行なうためのライブラリを中心としたパッケージです。 

得意なもの = 一つのファイルに対するキーワード検索 
     辞書・住所録・新聞一年分データなどの、巨大な単一ファイルに
     対する文字列検索。 

苦手なもの 
     複数ファイルに対する検索 
         電子メールのような多数のファイルに対する検索。 
     ファイルが手元にない状態での検索 
         WWWページの検索。 

-----------------------------
yoshihide hirose
mailto:yoshihide@xxxxxxxxxx
-----------------------------