Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: 再インストールと検索結果について
>追加キーワード数のところがCHASENとKAKASIでは異なった結果となっている
>のですがここはどのようなことが要因で差異が出ているのでしょうか?
一番の要因はkakasiはひらがな語の切り分けの能力が(全く)ない
ということです。
元々の用途が漢字交じりの文を平仮名に直すプログラムなので・・・
chasenなら
「わたしはまいにちこめをくう」を
「わたし は まい に ち こめ を くう」
必ずしも正しい分け方ではないですがとりあえず適当に
ひらがなを短く切ってくれます。
後はフレイズ検索頼みです。
それに対してkakasiはこれを1語として登録します。
この弱点を補完する方法は今のところ有りません。
あとkakasiの辞書は
「食べる(たべる)」
のような語は登録できますが
「ろ過(ろか)」「たべる(たべる)」
のような語は登録できません。
だからいとてきにひらがなをおおくふくんだぶん
などのけんさくにかんしてはかかしはきついのです。
通常の使用には関してはあまり問題はないと思うますが。
「けんさく」を含む文を検索したいときにはクエリは
*けんさく*
としないとすべては見つからない可能性が高いです。