Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 文書追加 (mknmz) 後、まったく Hit しない



みやざきです。

> >> 	2 パターン キーワードを替えて検索した新旧それぞれで 4 つの
> >> 	debug ログを個人宛てに送信しました。(66 K 弱)
> >> 
> >> 	Hit しない場合、namazu(debug): searching: rc12m という行が
> >> 	連続して出力されています。
> 
>   ログをみせていただいたのですが、base64 らしきデータが index に含まれ
> ているのがちょっと気になります...

	はい、確かにそのとおりです。

	KLEZ が大量に流れて来る ML で、Virus Protect はかかってい
	ますが、ローカルキャッシュ等が添付されている添付は大量にあ
	ります。

	Base64 を Cut して mknmz することができない (と認識してい
	ます) 場合は、~/.mknmzrc の $TEXT_SIZE_MAX を減らした方が
	よいでしょうか。
	(現在は $FILE_SIZE_MAX = 4000000 $TEXT_SIZE_MAX = 2000000)

>   検索実行時の引数も教えてもらえませんでしょうか? プライバシーに関わる
> ようでしたら再度個人宛てに送っていただいて構いません。

	http://search.namazu.org/ml/namazu-users-ja/msg02681.html

	こちらの文末に書いた mknmz は多少 Cut していました。

	実際は、

	  mknmz 2002-* -O outdir -r "s/ML\/Mail\//showmail.cgi\?ML\=/" -U -s -h

	としています。(-r, -U も行っています)

	なお、上記 URL で
	  - 2002-06 ディレクトリを含まない結果が、NMZ.log (before)
	  - 2002-06 を含んだ場合が、NMZ.log (after)
	となります。

	個人宛てで添付して rc12m が連続された debug log も、2002-06
	を含んだ (after) 場合の namazu コマンドを試した結果の出力
	です。

	なお、KLEZ が大量に流れて来る点では、2002-05 も 2002-06 も
	まったく同様でした。

■ Y A S U H I R O   M I Y A Z A K I ■
■  yasuhiro-miyazaki@xxxxxxxxxxxxx  ■