namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

XMLファイルを検索



はじめまして、セトと申します。

今NAMAZUでXMLファイルの検索システムを開発していますが。
それで問題があります。
KAKASIを使ってXMLファイルのインデックスファイルを作成すると
NMZ.wファイルの内容を調べるとXMLファイルのタグを含んだ形で
記述されています。

<partno>ms25041-4</partno>

のように記述されています。検索する時 ms*のような正規化表現で
検索したいので ms25041-4 のようなタグの内容のみのリストにしたい
のです。
これはおそらくHTLMLファイルでなくXMLファイルのためKAKASIが
テキストファイル(*.txt)として認識していると思います。

タグの内容のみ”ms25041-4 ”にする方法はないでしょうか?