Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: フレーズ検索のHASH値への変換方法



小舞です。自己訂正です。

Komai @home さんは書きました:
>つまり、メモリーを確保する上での話しで、通常使っている範囲では
>メモリーの確保の違いしかないということですね。
>kを
>k=BER圧縮されたデータのバイト数-(文書の総数 * 2)
>とすると、kは、それほど大きくはならない?(対象規模数万個程度を想定)
>例えば、簡単な説明として1万2千700百個のファイルがあって、127の等間隔で
>まばらにHITしている単語が
>あったとして、だいたい100バイト程度の差しかない。。ということでしょうか。

自己レスです。訂正です。
例えば、簡単な説明として1万2千800百個のファイルがあって、128の等間隔で
まばらにHITしている単語が
あったとして、だいたい100バイト程度の差しかない。。ということでしょうか。
(つまりBER値だと2byteの場合で、スコア値はまぁだいたい小さくて
BER値では127以下の場合。)
です。