Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: 日本語でのヒットが悪い
古川です。
From: maeda@xxxxxxxxxxxxxxx (前田和哉)
Subject: [namazu-users-ja] Re: 日本語でのヒットが悪い
Date: Fri, 30 Jun 2000 10:28:15 +0900
maeda> >// これは、私のとこでやったときのものですが。
maeda> >このように日本語で出て来てますか?
maeda> はいちゃんと日本語で出力されました。
maeda> indexの書き出しのほうは何も異常はないようですが・・
ありがちなのは、mknmz を何回か実行したときに、最初は LANG が設定されて
いたんだけど、追加したときには設定されていなかった、とか。
でも、そういう問題ではないらしいので、とすると…
From: maeda@xxxxxxxxxxxxxxx (前田和哉)
Subject: [namazu-users-ja] 日本語でのヒットが悪い
Date: Thu, 29 Jun 2000 16:02:49 +0900
maeda> 出てこないのです。。。10件はでるはずなのに2件しか出てこない。
maeda> # ヒット [松山:5][カラオケ:29]
「松山」が 5 件しかなければ、10 件は出てこないですね。
前田さんが「でるはず」と思ったファイルでは、「松山」は、どういった形
で含まれているでしょう?
インデックスは単語単位で作られています。単語の分かれかたは、kakasi の
辞書に依存しますが、標準の辞書だと、例えば「新松山」などは「新松」「山」
といった具合に分かれます。
maeda> という"松山"っていう文字を一つで読んでいる?
maeda> 他の漢字で検索すると
maeda> 例えば"牧志"だと[牧:*][志:*]っと二つに分けて検索しているみたいです。
maeda> これはkakasi自体がそういう設定になっているのでしょうか?
ここは、普通は、
Q. 「牧志」 だと「牧」と「志」に分かれてしまうんすけど
A. 辞書に「牧志」を登録してください。
となる場面です。
--
ヤマハ(株)ピアノプレーヤ設計課
古川 令
furukawa@xxxxxxxxxxxxxxxx