namazu-dev(ring)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: How to get tf value?
- From: Satoru Takabayashi <satoru-t@xxxxxxxxxxxxxxxxxx>
- Date: Thu, 21 Oct 1999 07:55:04 +0900
- References: <199910200251.LAA16227@ring.etl.go.jp> <199910200909.SAA29969@ring.etl.go.jp> <199910200925.SAA00633@ring.etl.go.jp>
namazu-dev に振ります
Satoru Takabayashi <satoru-t@xxxxxxxxxxxxxxxxxx> wrote:
> N = 全文書数
> n = キーワードが含まれる文章の数
> idf = log(N/n)
>
>なので、「[エントリの総数 * 2]」を 2 で割って算出できる値は
>n です。また、 N は「NMZ.t のサイズ / 4」で算出できます。細
よく考えてみると、「NMZ.t のサイズ / 4」で求めた全文書数は正
しくありません。なぜなら、インデックスを更新していくうちに欠
番が起きることがあるからです。
正確な全文書数を知るには (開発中の最新版なら) NMZ.status を
見ればわかります。修正しなければ。
p.s.
今日の午後からアメリカ西海岸に 10日間くらい遊びに行きます。
滞在先には T1 (1.5 Mbps) の専用線が来ているので連絡が途絶え
ることはありません。:-)
-- Satoru Takabayashi