Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 日本語でのヒットが悪い



古川です。

From: maeda@xxxxxxxxxxxxxxx (前田和哉)
Subject: [namazu-users-ja] Re: 日本語でのヒットが悪い
Date: Fri, 30 Jun 2000 10:28:15 +0900

maeda> >// これは、私のとこでやったときのものですが。
maeda> >このように日本語で出て来てますか?
maeda> はいちゃんと日本語で出力されました。
maeda> indexの書き出しのほうは何も異常はないようですが・・

ありがちなのは、mknmz を何回か実行したときに、最初は LANG が設定されて
いたんだけど、追加したときには設定されていなかった、とか。

でも、そういう問題ではないらしいので、とすると…


From: maeda@xxxxxxxxxxxxxxx (前田和哉)
Subject: [namazu-users-ja] 日本語でのヒットが悪い
Date: Thu, 29 Jun 2000 16:02:49 +0900

maeda> 出てこないのです。。。10件はでるはずなのに2件しか出てこない。

maeda> # ヒット [松山:5][カラオケ:29]

「松山」が 5 件しかなければ、10 件は出てこないですね。

前田さんが「でるはず」と思ったファイルでは、「松山」は、どういった形
で含まれているでしょう?

インデックスは単語単位で作られています。単語の分かれかたは、kakasi の
辞書に依存しますが、標準の辞書だと、例えば「新松山」などは「新松」「山」
といった具合に分かれます。


maeda> という"松山"っていう文字を一つで読んでいる?
maeda> 他の漢字で検索すると
maeda> 例えば"牧志"だと[牧:*][志:*]っと二つに分けて検索しているみたいです。
maeda> これはkakasi自体がそういう設定になっているのでしょうか?

ここは、普通は、

    Q. 「牧志」 だと「牧」と「志」に分かれてしまうんすけど
    A. 辞書に「牧志」を登録してください。

となる場面です。

-- 

                                        ヤマハ(株)ピアノプレーヤ設計課
                                                              古川 令
                                             furukawa@xxxxxxxxxxxxxxxx