namazu-ml(ring)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: XMLファイルを検索
- From: Ryuusei Murakami <d8011205@xxxxxxxxxxxx>
- Date: Sat, 09 Oct 1999 16:03:17 +0900
むらかみ@会津大院です。
>> XML を書いた事が無いのでよくわからないんですが、
>> 拡張子を認識させたいのなら、 mknmz の
>> my $HTML_SUFFIX = 'html?|[ps]html|html\.[a-z]{2}|asp|cgi';
>
>> 部分を書き直す事でできるような気がします。
>> *.xml っていう形式なら、
>> my $HTML_SUFFIX = 'html?|[ps]html|html\.[a-z]{2}|asp|cgi|xml';
>> こんな感じにすればいいんではないでしょうか。
>> #実験して無いので確証は無いです。
追加で、こっちも変更した方が都合がいいかも。
変更前:my $TARGET_FILE = '.*\.html?|.*\.txt|.*_default';
変更後:my $TARGET_FILE = '.*\.html?|.*\.txt|.*_default|.*\.xml';
> やってみました。
> 結果はタグの内容のみ”ms25041-4 ”になりました。
> ただし、ms*では検索出来ません。
> たしか正規化に関する部分はMNZ.wファイルだと思うのですが、
> このファイルに ms のようなリストがないといけないのでしょうか?
> Namazuで正規化検索する時のプロセス(どのファイルを使用するとか?)
> を教えていただけないでしょうか?
前方検索の部分は search.c の中の forward_match 関連ですね。
私も実験してみました。
Solaris 2.5.1/sparc,
Namazu v1.3.0.6 + kakasi v2.3
<partno>ms25041-4</partno>
<partno>ms25041-5</partno>
<partno>ms25041-6</partno>
<partno>ms25041-7</partno>
<partno>1-7</partno>
<partno>1-8</partno>
<partno>1-9</partno>
上記の様なサンプル・ファイルを2つ準備して mknmz した後、
% namazu "ms*" .
検索結果
参考ヒット数: [ ms* (マッチする単語が多すぎるので無視しました) ]
検索式にマッチする文書はありませんでした。
となってしまいましたが、
% namazu "/ms*/" .
% namazu "*ms*" .
とした場合は問題無く動作しました。
% University of AIZU
% Ryuusei Murakami / d8011205@xxxxxxxxxxxx
% http://himalayas.u-aizu.ac.jp/~murakami/