Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
pnamazu-2000.05.08
- From: Rei FURUKAWA <furukawa@xxxxxxxxxxxx>
- Date: Mon, 08 May 2000 03:02:55 +0900
- X-ml-name: namazu-users-ja
- X-mail-count: 00372
古川です。
perl 版検索クライアントを
http://www01.tcp-ip.or.jp/~furukawa/pnamazu/
に置きました。
#(1)! 簡易要約機能が有効になっていないと grep 機能が働かなかったのを修正
#(2)! NMZ.[ms]i? が無いときの後方・部分一致検索の動作を、本家と同じに
# した(わかち書きをやめた)。また、簡易キャッシュを有効にした。
#(3)! 複数インデックス検索時に、NMZ.{head,foot}.* をもう少し根気よく
# 探すようにした (Thanks to 小関吉則さん)
#(4)+ pnamazu 用の NMZ.tips.ja, NMZ.body.ja を同梱
(1) grep 機能とは、元ファイルを読んで、語を含む行を表示する機能です。
この機能が、簡易要約機能 (元ファイルを読んで、検索時に要約を作る
機能) を有効にしていないと、働かないようになっていましたので、
これを修正しました。
(2) perl 版では、後方・部分一致では、NMZ.m, NMZ.mi, NMZ.s, NMZ.si とい
う補助インデックスファイル (以下、NMZ.[ms]i? と言います) を使い、
わかち書きとの併用が可能になっています。
(例)
kakasi の辞書には「全文検索」がないため、「全文」「検索」と
分かれて登録されています。このとき「*全文検索*」を、きちんと
"*全文 検索*" と処理できる、という意味です。
そして、NMZ.[ms]i? が無い場合には、NMZ.w を使って、同等の検索をして
いました。
今回からは、NMZ.[ms]i? が無い場合には、正規版と同様、/全文検索/ と
扱われます。従って、「*全文検索*」はヒットしなくなります。
これをヒットさせたい場合には、NMZ.[ms]i? を作る必要があります。
このようにする理由は、
NMZ.w だけで後方・部分一致検索式をわかち書きするのは、
速度が遅い
ならば、無理にわかち書きするのはやめて、少しでも速くなった
方が嬉しい人もいるかも
したいという人は、補助インデックスを作ってもらえばよい
(インデックスのあるディレクトリで、"perl bwnmz.pl" と
するだけです)
NMZ.[ms]i? が無い場合の後方・部分一致検索は、簡易キャッシュ機能の
対象になります。
# くり返しになりますが、ここで「わかち書きしない」と言っているの
# は、「後方・部分一致検索との組み合わせ」だけです。通常のわかち
# 書きは、いままで通りおこなわれます。
(3) 複数インデックスの検索のとき、インデックスの親ディレクトリしか、
NMZ.head.*, NMZ.foot.* を探していませんでした。これを、子ディレ
クトリも探すようにしました。
(4) perl 版は、正規版と、使える検索式が少し違うので、それを反映した、
NMZ.body.ja, NMZ.tips.ja を作りました。
--
Rei FURUKAWA
furukawa@xxxxxxxxxxxx