namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

File::MMagic trouble



すぎうらしろうです。

現在、httpdown313(改)で適当にデータを収集し、namazu v1.9.4 でindex化と
いう作業をしています。そのとき、あるファイルに達すると

Can't locate object method "checktype_magic" via package "File::MMagic" at /usr/local/bin/mknmz line 511, <GEN4> chunk 3878.

というメッセージを出してindex化作業そのものが止まってしまいます。
あるファイルというのは、ファイルの先頭部分はテキストファイルだけど、途
中から何らかのトラブルでバイナリと化してしまっているファイルと、SJISで
かかれていて例えば"less  version 332+iso248+regex_cs-lwp9k"などでも文字
コード自動判別をしくじるようなファイルです。

lessでコード判別をしくじるようなファイルというのは、具体的には
http://www.kantei.go.jp/jp/clinton/1e050.html などです。
<TITLE>...</TITLE>の中の最初の1文字目"小"という文字の判別を間違えます。
nkf1.71をモジュールとして組み込んでいますが、このnkf単体ならちゃんと判
別するんで別の問題かもしれません。

--  
      すぎうらしろう(Sugiura Shiro)      E-mail : sugiura@xxxxxxxxxxxx
      (伊)x7                 <URL:http://www.kt.rim.or.jp/%7Esugiura/>
       御希望の方に、もれなく less-332.tar.gz をプレゼントしています
      [     If you want to talk with me, you MUST speak Japanese     ]