namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: 初めまして&全角中グロにつ いて質問です
塩崎さん、
早速のご返事、ありがとうございます。いただいたアドバイスを基にいろいろ試
してみました。
結果を先に言うと、わかち書きをchasenに切り換えたら、「・」がヒットするよ
うになりました。ありがとうございます。(^o^)
----------------------------------------------------------------------
検索結果
参考ヒット数: { [ ビル: 212 ] [ ・: 4149 ] [ ゲイツ: 119 ] :: 115 }
検索式にマッチする 115 個の文書が見つかりました。
----------------------------------------------------------------------
> これはおそらくkakasiでわかち書きされているのでしょう。
> 手許のkakasiで「ビル・ゲイツ」を試してみると「ビル . ゲイツ」になります。
> ですから、そもそも「・」はインデックスには現れないはずです。
私の環境のkakasiでは、「ビル・ゲイツ」は「ビル ・ ゲイツ」になります。
で、自分なりに考えたのですが、
●Namazuのソースを調べたら、codeconv.cに「2 bytes 英数字・記号を 1 byte
に変換するルーチン」がある。
●mknmzでのインデックス作成時に、上記のルーチンで1byteの「.」に変換される
ので、インデックスに「・」は出てこない。「.」で登録される。
●v1.2.0.2から「検索時に自前でわかち書きをするようにした」とのこと
●検索結果を見ると「・」はそのまま出てくるので、「自前のわかち書き」では
1byteの「.」に変換されない
●で、インデックスには「・」が無いのでヒットしない
ということなのかな? というのがとりあえずの結論です。
思いっきり外してたら申し訳ありません。
------------------------------------------------------------------------
塙 理和 Masakazu Hanawa 株式会社IDGコミュニケーションズ
hanawa@xxxxxxxxx 〒102 東京都千代田区富士見1-2-27
TEL 03-3222-6584 FAX 03-3222-5068