Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: NMZ.iのデータ長について
- From: "Komai @home" <GFH05144@xxxxxxxxxxx>
- Date: Tue, 23 Dec 2003 15:11:20 +0900
- X-ml-name: namazu-devel-ja
- X-mail-count: 03439
- References: <3FE46E57.5F34D2DF@asahi-net.or.jp>
小舞です。
Tadamasa Teranishi さんは書きました:
>2.1 系は [単語xを含む文書の総数*2] に統一して、プログラムを
>すっきり簡単にした方が良いかもしれません。
>ただ、似て非なるものは誤解の元ですから、どうせならもっといろいろな
>部分に手を加えて、全く別のフォーマットにしたいところです。
2.1系は、もしかしたら大幅にNamazuが生まれかわるかもしれない、という
期待もこめて、似て非なるフォーマットでない方がいいという考えにも賛同して
アイディアとして、以下のようなことを投稿しておきます。
(すみませんアイディアだおれかも。。)
[観点]
スコアの計算方法をユーザーが新規に考えたのを取り込みやすくして
より面白いものがでたら対応しやすくする。
1)2.1 系は NMZ.iは[単語xを含む文書の総数] に統一
2)スコア値と文書IDが現在同じファイル(NMZ.i)に書かれているが、
スコア値を別ファイルにする。
3)mknmz側も、すっきりと、スコアの計算方法をユーザーが適当に
新規に考えたのを取り込みやすくする。
イメージ
NMZ.i
単語xを含む文書の総数:文書ID、文書ID 、、(差分)
NMZ.score
単語xを含む文書の総数:スコア、スコア、、、(差分無し)
=kp@stellar=