Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: フレーズ検索のHASH値への変換方法
小舞です。自己訂正です。
Komai @home さんは書きました:
>つまり、メモリーを確保する上での話しで、通常使っている範囲では
>メモリーの確保の違いしかないということですね。
>kを
>k=BER圧縮されたデータのバイト数-(文書の総数 * 2)
>とすると、kは、それほど大きくはならない?(対象規模数万個程度を想定)
>例えば、簡単な説明として1万2千700百個のファイルがあって、127の等間隔で
>まばらにHITしている単語が
>あったとして、だいたい100バイト程度の差しかない。。ということでしょうか。
自己レスです。訂正です。
例えば、簡単な説明として1万2千800百個のファイルがあって、128の等間隔で
まばらにHITしている単語が
あったとして、だいたい100バイト程度の差しかない。。ということでしょうか。
(つまりBER値だと2byteの場合で、スコア値はまぁだいたい小さくて
BER値では127以下の場合。)
です。