namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

namazu-1.4.0.0-alpha-4



古川です。

>> On Tue, 16 Feb 1999 12:21:50 +0900 (JST), Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx> said:
  > 最近、(仕事で、ではないのですが) 時間がとれなくなって、ダウンロードは
  > するものの、なかなか評価することができないでいます。が、
  >> # そろそろ古川さんに評価してもらいたいところ :-)
  > 私も評価してみたいところです。

動かしてみました。

    FreeBSD-2.2.6 + namazu-1.4.0.0-alpha-4
    nkf, kakasi は module ではなく、普通のもの

# NMZ.log を家に置いてきてしまったので、雑な記録ですみません


namazu-ml のログで実験してみたところ、問題なく動いているようです。

# pnamazu でも対応してしまいました。

これから、深く味わいたいと思います。


ところで、

>> On Fri, 5 Feb 1999 19:31:01 +0900 (JST), Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx> said:
  > 近々、データベースの pack 'w' 化が予定されていますが、フォーマットの変
  > 更点を、次のように予想しているのですが、こんな感じでよいでしょうか?

 >> doc/ja/nmz_files.txt より
  >> * NMZ.i
  >> [単語1\n]
  >> [エントリの総数 * 2][文書ID][スコア][文書ID][スコア]....\n
  >> [単語2\n]
  >> [エントリの総数 * 2][文書ID][スコア][文書ID][スコア]....\n
  >> [単語3\n]
  >> [エントリの総数 * 2][文書ID][スコア][文書ID][スコア]....\n
  >> ...

  > 「エントリの総数 * 2」「文書ID」「スコア」が pack 'w' される。

ここの「エントリの総数 * 2」は、

    「[文書ID][スコア][文書ID][スコア]....」のサイズ

になって、

それと、

  >> * NMZ.p
  >>     [ハッシュ値\x0000を含む文書ID][ハッシュ値\x0000を含む文書ID]...
  >>     [ハッシュ値\x0001を含む文書ID][ハッシュ値\x0001を含む文書ID]...
  >>     ...
  >>     [ハッシュ値\xffffを含む文書ID][ハッシュ値\xffffを含む文書ID]
  > これは、正しくは
  >     [ハッシュ値\x0000を含む文書数][ハッシュ値\x0000を含む文書ID]...
  >     [ハッシュ値\x0001を含む文書数][ハッシュ値\x0001を含む文書ID]...
  >     ...
  >     [ハッシュ値\xffffを含む文書数][ハッシュ値\xffffを含む文書ID]
  > ですよね?で、変更点は、
  > 「文書数」「文書 ID」が、pack 'w' される

ここの「ハッシュ値\x0000を含む文書数」 は、

    「[ハッシュ値\x0000を含む文書ID]...」のサイズ

になった、で正しいですか?


それと、NMZ.total、NMZ.keys というものができるようになったのですが、こ
れの意味合いは、どんなところでしょうか?


# gcnmz も対応しないといけませんね。

-- 

                                        ヤマハ(株)ピアノプレーヤ設計課
                                                              古川 令
                                             furukawa@xxxxxxxxxxxxxxxx