Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: NMZ.iのデータ長について



小舞です。

Tadamasa Teranishi さんは書きました:
>2.1 系は [単語xを含む文書の総数*2] に統一して、プログラムを
>すっきり簡単にした方が良いかもしれません。
>ただ、似て非なるものは誤解の元ですから、どうせならもっといろいろな
>部分に手を加えて、全く別のフォーマットにしたいところです。

2.1系は、もしかしたら大幅にNamazuが生まれかわるかもしれない、という
期待もこめて、似て非なるフォーマットでない方がいいという考えにも賛同して
アイディアとして、以下のようなことを投稿しておきます。
(すみませんアイディアだおれかも。。)

[観点]
スコアの計算方法をユーザーが新規に考えたのを取り込みやすくして
より面白いものがでたら対応しやすくする。

1)2.1 系は NMZ.iは[単語xを含む文書の総数] に統一
2)スコア値と文書IDが現在同じファイル(NMZ.i)に書かれているが、
スコア値を別ファイルにする。
3)mknmz側も、すっきりと、スコアの計算方法をユーザーが適当に
新規に考えたのを取り込みやすくする。

イメージ
NMZ.i
単語xを含む文書の総数:文書ID、文書ID 、、(差分)

NMZ.score
単語xを含む文書の総数:スコア、スコア、、、(差分無し)

=kp@stellar=