Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
nmz/wakati.c with chasen (namazu-bugs-ja#33)
- From: otake@xxxxxxxxxxxxxxxxxxxxxx
- Date: Wed, 23 Aug 2000 17:12:27 +0900 (JST)
- X-ml-name: namazu-devel-ja
- X-mail-count: 00715
Full_Name: 大竹 清敬
Version: 2.0.4
OS: linux 2.2.16
Submission from: (NULL) (133.15.168.7)
初めて投稿します。
大竹と申します。
私のところでは、諸般の理由からchasen2.02 を利用してます。
ところが、chasen を用いて index を作成した場合に
検索できない場合がありますので、報告します。
chasenを用いる場合、例えば、コンピュータシステムのような単語は
コンピュータ + システム のように形態素解析されてしまいます。
ところが、nmz/wakati.c にある nmz_wakati() の中では、
ひらがなとカタカナの場合には一文字ずつnmz_binsearchが実行
されないため、検索できないことがわかりました。
現在は該当部分をコメントアウトし、検索できています。
ただ、これが他にどんな影響を与えるかは私にはわかりかねます。