namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Non wakatigaki
かわとです。
□■ Satoru Takabayashiさんから 11月26日(Thu)16時47分頃に頂いたメイル、
■□『 [namazu:01663] Re: Non wakatigaki 』より。
>安易な方法としては現状でも 『*ひらがな*』 のように両側にアスタリス
>クをつければひらがなの語も検索できます。
はい、短期的にはそれで妥協せざるをえないかなぁと思っています。これ
だとchasenよりはkakasiの方が向いているのでしょうね。
でも、漢字/平仮名が混在したキーワードに対して辛くなりませんかね?
(ヒットもするだろうけど、誤ヒットも増える? そんなことはない!?)
まぁ当たらないよりはましなので、ゴミが増えても我慢してもらうことに
なるでしょうけど。
--
>ただ、 Namazuのフレイズ検索の精度では今度は逆に「存在しない単語が
>見つかってしまう」事態が発生します。2文字づつ登録すれば少しはまし
>になるかもしれませんが。
なので、そこが先程のメールに書いていた「繋がりに意味を持たせる」と
いうところで、何らかの方法で出現順や隣接情報まで覚えさせられれば、
ウソの結果を出す確率は大幅に減るとは思います。問題は、その情報を
どう持たせるか、というところですけど…。
># 辞書を使わない方式だと『林哲』で検索して『高林哲』がヒットしてし
># まう弊害もあります。気にするほどの問題ではないと思いますが。
私の出した要望の方向で考えれば、これは仕方がないでしょうね(^^;
#grepでは日常茶飯事だし(^^;;;
------------------------------------------------------------------
-- 川戸 勝史(KAWATO Katsushi) -- <kawato@xxxxxxxxxxxxxxxx>
(株)NEC情報システムズ・情報インターネットSI事業部
------------------------------------------------------------------