Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: phrase search
Satoru Takabayashi <satoru-t@xxxxxxxxxxxxxxxxxx> wrote:
> その単語を含む文書ID + 出現位置のリスト
>
>のように変えた方がいいのでは、という提案です。後者の方法では
>フレーズを確実に検索できます。
出現位置を記録しておけば、検索結果に「マッチした付近のテキス
ト」を表示できますね。(検索対象がテキストファイルの場合)
また、「foo と bar の距離は n以内」という検索もできます (近
傍検索と呼ぶらしい)。テキストの照合に時間をかければ、同じ文
の中、同じパラグラフの中、といった検索も可能でしょう。
>という比率になると予想できます。約1.5倍です (かなり大ざっぱ
>ですが)。何か勘違いしているかなあ。どうでしょう? > 古川さん
サイズが多少、大きくなっても zlib での圧縮に対応すれば問題な
いですよね。近日中に検証します。
# ところで、ebzip した辞書の検索と普通の辞書の検索ではどのく
# らい性能に差が出ます? 実験結果などありませんか? > 笠原さん
-- Satoru Takabayashi