Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: フレーズ検索のHASH値への変換方法
> 千葉市中央区長洲
> 藤原 誠
> #いいだしっぺなので、案を整理します。
> 【元の表現】
> [単語1を含む文書の総数 * 2][文書ID][スコア][文書ID][スコア]...
> 【寺西さん案】
> [単語1を含む文書IDとスコアのバイト数][文書ID][スコア][文書ID][スコア]...
> 【小舞案1】
> 「単語1でHITのデータ領域のBER範囲」[文書ID][スコア][文書ID][スコア]...
> もう一つ案を追加。
> 【小舞案2】
> 「単語1に関するデータ領域のバイト数」[文書ID][スコア][文書ID][スコア]...
これは可変長レコードで、
「単語1データのレコード長」[文書ID][スコア][文書ID][スコア]...
あるいはもっと簡単に
「レコード長」[文書ID][スコア][文書ID][スコア]...
ではどうでしょうか ?
ただし「単語1データのレコード長」はおおよその数として、
「単語1を含む文書の総数 * 2」になる、
---
(藤原)