Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: フレーズ検索のHASH値への変換方法
- From: "Komai @home" <GFH05144@xxxxxxxxxxx>
- Date: Sun, 08 Jun 2003 10:29:14 +0900
- X-ml-name: namazu-users-ja
- X-mail-count: 03320
- References: <3EE22A89.204AD267@asahi-net.or.jp>
小舞です。
いろいろアドバイスありがとうございます。
やはりPerl(mknmz)をきちんと解読しないといけないですね。。。
Tadamasa Teranishi さんは書きました:
>これは、文書ID の総数と スコアの総数 であり、(文書IDの個数と
>スコアの個数は同じため)結果的には 文書の総数 * 2 になっている
>のではないかと思います。
>あくまでも個数であって、バイト数ではないので偶数でもなんら問題
>ないでしょう。
Perlがよくわかっていないため、ファイルの仕様(+自分の想像も含む)から
Cでファイルを読み込んで、再理解する、、という感じでえらく迂遠な
方法をとっているので、こんな自分のような変な理解が起きるのかもしれません。。
自分も、最初、文書総数×2(のBER値)と思っていて、
必ず偶数ということで、2で割れば、単語ID?番を含む文書IDの総数が
でるので、それで良いと思っていたのですが、、
奇数になることも、あって、2で割り切れないから、
あれっ?、、と思った次第です。