Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: kanwadict(kakasiの辞書)について
KAKASI の話題なので、kakasi-dev で行なう方が適切な気もします。
At Fri, 18 Jul 2003 18:19:54 +0900,
h-nakatomi@xxxxxxxxx wrote:
> 検索の精度を上げるため、kakasi辞書の強化に取り組んでいます。
> 具体的には、NMZ.slogから、ユーザが、どんなキーワードで検索
> しているのか抽出して、mkkanwaコマンドで追加していこうと考え
> ています。
> そこで質問ですが、kanwadictには、同じ行が複数、登録されて
> いくのですか?それとも、重複する行は削除してくれるのでしょうか?
質問の意味は、
* 新規キーワードのみを記録したファイルを用意
* それを mkkanwa コマンドに処理させる
* 既存の辞書に既に同じエントリがあった場合、生成される kanwadict には
同じエントリが追加されてしまうのか
ということだと理解しました。
mkkanwa はまったく新規の辞書を作成するためのコマンドなので、このよう
な流れで処理を行なうと、新規キーワードのみが入力された辞書が作成されて
しまいます。
KAKASI のソースに附属の kakasidict と一緒に mkkanwa に処理させるのが
よいでしょう。
同一の単語の重複チェックはしていなかったと思うので、自力で除外するか、
気にせずそのまま使うか、どちらかを選択する必要があります。
--
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx
knok@xxxxxxxxxx / knok@xxxxxxxxxx