namazu-dev(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: How to get tf value?



namazu-dev に振ります

Satoru Takabayashi <satoru-t@xxxxxxxxxxxxxxxxxx> wrote:

>  N = 全文書数
>  n = キーワードが含まれる文章の数
>  idf = log(N/n)
>
>なので、「[エントリの総数 * 2]」を 2 で割って算出できる値は 
>n です。また、 N は「NMZ.t のサイズ / 4」で算出できます。細

よく考えてみると、「NMZ.t のサイズ / 4」で求めた全文書数は正
しくありません。なぜなら、インデックスを更新していくうちに欠
番が起きることがあるからです。

正確な全文書数を知るには (開発中の最新版なら) NMZ.status を
見ればわかります。修正しなければ。

p.s.
今日の午後からアメリカ西海岸に 10日間くらい遊びに行きます。
滞在先には T1 (1.5 Mbps) の専用線が来ているので連絡が途絶え
ることはありません。:-)

-- Satoru Takabayashi