Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: pointer is byte count ? (Re: NMZ.i (Re:http://www.namazu.org/doc/nmz.html ))
> 千葉市中央区長洲
> 藤原 誠
これで commit しておきます。
皆様、ありがとうございます。
おさわがせ致しました。
---
(藤原)
===File /tmp/u==============================================
Index: ja/nmz.html
===================================================================
RCS file: /storage/cvsroot/namazu/doc/ja/nmz.html,v
retrieving revision 1.12
diff -u -r1.12 nmz.html
--- ja/nmz.html 6 Apr 2000 01:40:01 -0000 1.12
+++ ja/nmz.html 8 Jul 2003 23:42:00 -0000
@@ -42,11 +42,13 @@
<h3>構造</h3>
+単語毎に、[その単語を含む文書 ID][スコア]を並べて「レコード」を作る。
+その長さは可変になるので、先頭に、そのデータ長を記録する。
<pre>
- [単語1を含む文書の総数 * 2][文書ID][スコア][文書ID][スコア]...
- [単語2を含む文書の総数 * 2][文書ID][スコア][文書ID][スコア]...
- [単語3を含む文書の総数 * 2][文書ID][スコア][文書ID][スコア]...
+ [単語1用 データ長][文書ID][スコア][文書ID][スコア]...
+ [単語2用 データ長][文書ID][スコア][文書ID][スコア]...
+ [単語3用 データ長][文書ID][スコア][文書ID][スコア]...
:
</pre>
@@ -160,9 +162,12 @@
<pre>
- [ハッシュ値\x0000を含む文書数][ハッシュ値\x0000を含む文書ID]...
- [ハッシュ値\x0000を含む文書数][ハッシュ値\x0001を含む文書ID]...
- [ハッシュ値\x0000を含む文書数][ハッシュ値\xffffを含む文書ID]...
+ |← データバイト数1 →|
+[データバイト数1][ハッシュ値\x0000を含む文書ID 1][ハッシュ値\x0000を含む文書ID 2]...
+ |← データバイト数2 →|
+[データバイト数2][ハッシュ値\x0001を含む文書ID 1][ハッシュ値\x0001を含む文書ID 2]...
+...
+[データバイト数n][ハッシュ値\xffffを含む文書ID 1]...
</pre>
Index: en/nmz.html
===================================================================
RCS file: /storage/cvsroot/namazu/doc/en/nmz.html,v
retrieving revision 1.10.8.1
diff -u -r1.10.8.1 nmz.html
--- en/nmz.html 11 Jul 2001 07:40:44 -0000 1.10.8.1
+++ en/nmz.html 8 Jul 2003 23:42:00 -0000
@@ -42,11 +42,14 @@
<h3>Structure</h3>
+For each word, the pair of [documentID containing that word][score]
+is stored sequencially, making the record for the word.
+The record is of variable length, the byte count of each data part
+is placed in front of them.
<pre>
-
- [number of documents word1 is found * 2][documentID][score][documentID][score]...
- [number of documents word2 is found * 2][documentID][score][documentID][score]...
- [number of documents word3 is found * 2][documentID][score][documentID][score]...
+ [data length for word1][documentID][score][documentID][score]...
+ [data length for word2][documentID][score][documentID][score]...
+ [data length for word3][documentID][score][documentID][score]...
:
</pre>
@@ -163,9 +166,13 @@
<pre>
- [number of documents including hash value \x0000][documentID including hash value \x0000]...
- [number of documents including hash value \x0000][documentID including hash value \x0001]...
- [number of documents including hash value \x0000][documentID including hash value \xffff]...
+ |<------ data byte count (1) ------->|
+[data byte count(1)][documentID including hash value \x0000]...
+ |<------ data byte count (2) ------->|
+[data byte count(2)][documentID including hash value \x0001]...
+...
+[data byte count(n)][documentID including hash value \xffff]...
+
</pre>
============================================================