Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: バグ報告
> 千葉市中央区長洲
> 藤原 誠
岩谷さん、
良く Software Design の記事を拝見致しています。素適ですね。
(以前に個人メールをいただいたこともあると思います。その時には
失礼致しました)
さて、
岩谷さん> namzu -ah xfs . >testresult.html
岩谷さん> 等とします。xfsという語が文章中に複数個含まれるファイルで、検索に
この件ですが、簡単に言ってしまえば、kakasi で見つからなくて
ChaSen で見つかるということですよね。
Namazu は、日本語の場合、一番初めのわかち書きを、外部の
kakasi / chasen に頼っていて、単語の切出しの品質というのは、
かなりというか完全にそちらに依存しています。
そうして、これら二つにもそれぞれに得意不得意があって、
さらにそれらが頼っている辞書にも依存します。ですから、こういう
ことはあり得ます。例えばひらがなだけで出来ている単語とかが、
一番はっきりしています。
一つだけ出していただいた例が xls だと思うのですが、
(とここまで書いて、自分で試して見たら xls だったら見つかるは
ずなので)、馬場さんが書いているように、岩谷さんの環境設定の
可能性も残っていますね。ただ chasen では一部にせよ動いている
そうなので、mknmz を実行した時の環境変数が問題になっているの
かも知れません。
例えば次を見ていただきたいと思います。
http://www.namazu.org/doc/tutorial.html#japanese
(これは 2.0.6 の説明です)
---
(藤原)
http://www.ki.nu/software/NetBSD/iBook2/
http://www.ki.nu/software/namazu/tutorial/