namazu-dev(ring)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
*.gz file handling (Re: broken html file's result)
From: Satoru Takabayashi <satoru-t@xxxxxxxxxxxxxxxxxx> さん曰く
Subject: [namazu-dev 1445] Re: broken html file's result
Message-ID: <200002030957.SAA11267@xxxxxxxxxxxxxx>
Date: Thu, 03 Feb 2000 18:58:26 +0900
高林> >修正済みのソースでもうひとつ気付いたのですが、*"* だけ '"e;'
高林> >で表示されるようです。
高林>
高林> う、ただいま修正して commit しました。
ありがとうございます。動作確認しました。
## 以下、話は変わって。。。^^;
## もしかすると、Namazu 2.x ではサポートしない動きかもしれないの
## ですが。
gzip された (mail/news の) file を mknmz しようとしたのですが、
以下のようになります。
% mknmz -U -O ./ -F zzz.txt (-h は付けてもつかなくても同じ結果)
設定ファイルを読み込み中: /usr/local/etc/namazu/mknmzrc
対象ファイル数: 354 (走査性能: 経過秒: 1, ファイル/秒: 354.0)
0 /home/shirai/Mail/@sugar.rdmg.mgcs.mei.co.jp#shirai/#mh/ml/mhc/1.gz [message/rfc822]
1 /home/shirai/Mail/@sugar.rdmg.mgcs.mei.co.jp#shirai/#mh/ml/mhc/10.gz [message/rfc822]
....
[基本]
日付: Fri Feb 4 16:34:05 2000
追加された文書の数: 353
サイズ (bytes): 512,678
合計の文書数: 353
追加キーワード数: 944
合計キーワード数: 944
わかち書き: module_kakasi -ieuc -oeuc -w
経過時間 (秒): 30
ファイル/秒: 11.7666666666667
システム: solaris
Perl: 5.00502
Namazu: 1.9.14
% head zzz.txt
/home/shirai/Mail/@sugar.rdmg.mgcs.mei.co.jp#shirai/#mh/ml/mhc/1.gz
/home/shirai/Mail/@sugar.rdmg.mgcs.mei.co.jp#shirai/#mh/ml/mhc/10.gz
....
とうまくいっている感じなのですが、
% head NMZ.field.subject
1.gz (Text File)
10.gz (Text File)
....
% head NMZ.field.from
(unknown)
(unknown)
....
と text 扱いされています。また、NMZ.w も意味がある内容ではなく、
その後の namazu も動きません(ヒットしない)。
なんだか、gzip されたままと gzip を解いたものが処理の中で混在し
ているような気もするのですが、C も Perl も手が出ないので、報告だ
けでごめんなさい。
--
白井秀行 (mailto:shirai@xxxxxxxxxxxxxxxxxxx)