Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
mknmz 実行時の KAKASI の不具合
- From: itou-souichi@xxxxxxxxx
- Date: 13 Dec 2000 14:48:00 +0900
- X-ml-name: namazu-users-ja
- X-mail-count: 01319
伊藤と申します。
遅くなりましたが、「商用データベースでのNamazu使用は?」の件、
お答え頂きありがとうございました。
今回は、質問のメールです。
mknmzでインデックス作成を行った時のNMZ.wについてです。
(例)test.txt
私の趣味は、車です。
このテキストファイルを、mknmzのインデックス作成の対象ディレクトリに置き、
mknmzを実行します。
この時、NMZ.wには、test.txtに記述されている
「私の趣味は、車です。」そのものが書かれてしまいます。
従って、キーワード「趣味」で検索しても、test.txtはヒットしません。
もちろん、「趣味」を中間一致で検索すれば、test.txtはヒットします。
ここで疑問に感じたのですが、
NMZ.wには、分かち書きされた単語が、書かれているわけではないのですか?
NMZ.wは、正規表現・部分一致検索時に使用する単語表であるとのことですが、
(ソシム 西村めぐみ著 「オープンソースソフトウェアによる全文検索・データベースWebの作り方」より)
namazuのプログラムソースを見たところ、通常の検索(特別な検索式を用いない)においても、
NMZ.wの単語表を参照しているようです。
このことから、NMZ.wには、分かち書きされた単語が書かれると考えた方が自然ですよね。
従って、mknmzの実行時に分かち書きを行うKAKASIが、
正常に動作していないのではないかと考えました。
もしそうだとしたら、考えられる原因を教えて頂きたいのです。
コンパイル、インストールを何回かして繰り返してみましたが、うまくいきません。
KAKASI自体は、正常に動作しています。telnet等のコマンドラインから、
kakasi -w < test.txt
とすれば、分かち書きを行います。
ご参考になるかどうかわかりませんが、
Namazu 2.0.5
kakasi 2.3.2
Text::kakasi 1.04
linux 2.0.36
という環境です。
自力での解決策が見出せませんので、よろしくお願い致します。