namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 初めまして&全角中グロにつ いて質問です



塩崎さん、
早速のご返事、ありがとうございます。いただいたアドバイスを基にいろいろ試
してみました。

結果を先に言うと、わかち書きをchasenに切り換えたら、「・」がヒットするよ
うになりました。ありがとうございます。(^o^)
----------------------------------------------------------------------
検索結果
参考ヒット数: { [ ビル: 212 ] [ ・: 4149 ] [ ゲイツ: 119 ] :: 115 } 
検索式にマッチする 115 個の文書が見つかりました。
----------------------------------------------------------------------

> これはおそらくkakasiでわかち書きされているのでしょう。
> 手許のkakasiで「ビル・ゲイツ」を試してみると「ビル . ゲイツ」になります。
> ですから、そもそも「・」はインデックスには現れないはずです。

私の環境のkakasiでは、「ビル・ゲイツ」は「ビル ・ ゲイツ」になります。

で、自分なりに考えたのですが、
●Namazuのソースを調べたら、codeconv.cに「2 bytes 英数字・記号を 1 byte
 に変換するルーチン」がある。
●mknmzでのインデックス作成時に、上記のルーチンで1byteの「.」に変換される
 ので、インデックスに「・」は出てこない。「.」で登録される。
●v1.2.0.2から「検索時に自前でわかち書きをするようにした」とのこと
●検索結果を見ると「・」はそのまま出てくるので、「自前のわかち書き」では
 1byteの「.」に変換されない
●で、インデックスには「・」が無いのでヒットしない
ということなのかな? というのがとりあえずの結論です。
思いっきり外してたら申し訳ありません。

------------------------------------------------------------------------
 塙 理和   Masakazu Hanawa        株式会社IDGコミュニケーションズ
 hanawa@xxxxxxxxx                  〒102 東京都千代田区富士見1-2-27
                                   TEL 03-3222-6584 FAX 03-3222-5068