namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: XMLファイルを検索



むらかみ@会津大院です。

>> XML を書いた事が無いのでよくわからないんですが、
>> 拡張子を認識させたいのなら、 mknmz の

>> my $HTML_SUFFIX = 'html?|[ps]html|html\.[a-z]{2}|asp|cgi';
> 
>> 部分を書き直す事でできるような気がします。
>> *.xml っていう形式なら、

>> my $HTML_SUFFIX = 'html?|[ps]html|html\.[a-z]{2}|asp|cgi|xml';

>> こんな感じにすればいいんではないでしょうか。
>> #実験して無いので確証は無いです。

追加で、こっちも変更した方が都合がいいかも。

変更前:my $TARGET_FILE = '.*\.html?|.*\.txt|.*_default'; 
変更後:my $TARGET_FILE = '.*\.html?|.*\.txt|.*_default|.*\.xml';

> やってみました。
> 結果はタグの内容のみ”ms25041-4 ”になりました。
> ただし、ms*では検索出来ません。
> たしか正規化に関する部分はMNZ.wファイルだと思うのですが、
> このファイルに ms のようなリストがないといけないのでしょうか?
> Namazuで正規化検索する時のプロセス(どのファイルを使用するとか?)
> を教えていただけないでしょうか?

前方検索の部分は search.c の中の forward_match 関連ですね。

私も実験してみました。

Solaris 2.5.1/sparc, 
Namazu v1.3.0.6 + kakasi v2.3

<partno>ms25041-4</partno>
<partno>ms25041-5</partno>
<partno>ms25041-6</partno>
<partno>ms25041-7</partno>
<partno>1-7</partno>
<partno>1-8</partno>
<partno>1-9</partno>

上記の様なサンプル・ファイルを2つ準備して mknmz した後、

% namazu "ms*" .
検索結果

参考ヒット数:  [ ms* (マッチする単語が多すぎるので無視しました) ] 

検索式にマッチする文書はありませんでした。

となってしまいましたが、

% namazu "/ms*/" .
% namazu "*ms*" .

とした場合は問題無く動作しました。



% University of AIZU 
% Ryuusei Murakami / d8011205@xxxxxxxxxxxx 
% http://himalayas.u-aizu.ac.jp/~murakami/