namazu-dev(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

*.gz file handling (Re: broken html file's result)



From: Satoru Takabayashi <satoru-t@xxxxxxxxxxxxxxxxxx> さん曰く
Subject: [namazu-dev 1445] Re: broken html file's result
Message-ID: <200002030957.SAA11267@xxxxxxxxxxxxxx>
Date: Thu, 03 Feb 2000 18:58:26 +0900

高林> >修正済みのソースでもうひとつ気付いたのですが、*"* だけ '&quote;'
高林> >で表示されるようです。
高林> 
高林> う、ただいま修正して commit しました。

ありがとうございます。動作確認しました。

## 以下、話は変わって。。。^^;
## もしかすると、Namazu 2.x ではサポートしない動きかもしれないの
## ですが。

gzip された (mail/news の) file を mknmz しようとしたのですが、
以下のようになります。

% mknmz -U -O ./ -F zzz.txt (-h は付けてもつかなくても同じ結果)
設定ファイルを読み込み中:  /usr/local/etc/namazu/mknmzrc
対象ファイル数: 354 (走査性能: 経過秒: 1, ファイル/秒: 354.0)
0 /home/shirai/Mail/@sugar.rdmg.mgcs.mei.co.jp#shirai/#mh/ml/mhc/1.gz [message/rfc822]
1 /home/shirai/Mail/@sugar.rdmg.mgcs.mei.co.jp#shirai/#mh/ml/mhc/10.gz [message/rfc822]
....
[基本]
日付:                Fri Feb  4 16:34:05 2000
追加された文書の数:  353
サイズ (bytes):      512,678
合計の文書数:        353
追加キーワード数:    944
合計キーワード数:    944
わかち書き:          module_kakasi -ieuc -oeuc -w
経過時間 (秒):       30
ファイル/秒:         11.7666666666667
システム:            solaris
Perl:                5.00502
Namazu:              1.9.14


% head zzz.txt 
/home/shirai/Mail/@sugar.rdmg.mgcs.mei.co.jp#shirai/#mh/ml/mhc/1.gz
/home/shirai/Mail/@sugar.rdmg.mgcs.mei.co.jp#shirai/#mh/ml/mhc/10.gz
....

とうまくいっている感じなのですが、


% head NMZ.field.subject
1.gz (Text File)
10.gz (Text File)
....

% head NMZ.field.from
(unknown)
(unknown)
....

と text 扱いされています。また、NMZ.w も意味がある内容ではなく、
その後の namazu も動きません(ヒットしない)。

なんだか、gzip されたままと gzip を解いたものが処理の中で混在し
ているような気もするのですが、C も Perl も手が出ないので、報告だ
けでごめんなさい。

-- 
白井秀行 (mailto:shirai@xxxxxxxxxxxxxxxxxxx)