namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Phrase search (Re: [Q] OpenText Style?)
Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx> wrote:
>> それはともかく 8bit * 8bit の表を作れば二つの単語によるフレーズが
>> ある程度の精度で調べられますよね (個々の単語のAND検索は済んでいる
>> ので)。で、それを重ねていけば 3, 4, 5...語のフレーズ検索もできそう
>> です。どの程度の精度が出るかは計算できません (私には無理)。
>
>私にも無理。まあ、よく分からないから、作りやすそうなものから試してみる、
>という方針でいいのではないでしょうか。
ですね。どの程度の精度が出るか計算不能というところがちょっとあれで
すが、そこそこ使えるものになるのではないかと期待しています。とりあ
えず着手しました。
>高林さんの方で mknmz.pl の対応をしてもらえれば、まずは perl 版で実験、
>というのでもいいですし。(ショックはさらに小さいでしょう)
クライアント側の実装もそんなに大変じゃないのでまずは Cで書いてみま
す。今日、明日中にでも動くものを準備する予定です。効率の良いハッシュ
関数なんかはまた後で考えることにします。
# 英語と英語、日本語と日本語で衝突しにくい関数が理想的ですね。英語
# と日本語がぶつかるのはほとんど問題にならないので。
--
高林 哲 Satoru Takabayashi