Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: phrase search



Satoru Takabayashi <satoru-t@xxxxxxxxxxxxxxxxxx> wrote:

>  その単語を含む文書ID + 出現位置のリスト
>
>のように変えた方がいいのでは、という提案です。後者の方法では
>フレーズを確実に検索できます。

出現位置を記録しておけば、検索結果に「マッチした付近のテキス
ト」を表示できますね。(検索対象がテキストファイルの場合)

また、「foo と bar の距離は n以内」という検索もできます (近
傍検索と呼ぶらしい)。テキストの照合に時間をかければ、同じ文
の中、同じパラグラフの中、といった検索も可能でしょう。


>という比率になると予想できます。約1.5倍です (かなり大ざっぱ
>ですが)。何か勘違いしているかなあ。どうでしょう? > 古川さん

サイズが多少、大きくなっても zlib での圧縮に対応すれば問題な
いですよね。近日中に検証します。

# ところで、ebzip した辞書の検索と普通の辞書の検索ではどのく
# らい性能に差が出ます? 実験結果などありませんか? > 笠原さん

-- Satoru Takabayashi