Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
 Re: File::Magicでの挙動
  菅です。
  Mac の pdf ではないのですが、時として *.doc もかなり 未対応の形式 になって
  しまいます。パスの途中で日本語のpath(%B5....) 等の場合だけかと思って
  いましたが、そうでもないようです。
#日本語パス名が入っていても出来て良いように思いますし。。
  あるファイルが 未対応 となったので、直接調べてみると、
% wvVersion  /XX/XXXXX/XXX/aa.doc
Version: word8 or higher, Encrypted: No
% wvhtml /XX/XXXXX/XXX/aa.doc aa.html
% nkf -e aa.html |more
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.or
g/TR/REC-html40/loose.dtd">
<html> 
<head> 
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=UTF-8">
<META NAME="GENERATOR" CONTENT="wvWare/wvWare version 0.7.6">
<title> 
:
:
  と、言う感じでちゃんと出来ていそうな気がするのですが判定では 未対応 と
  なるので、index 化されていないと思われます。先日の判定に使用した
  File スクリプトでの判断でも application/msword と、なります。
  このような場合の対処はどのように考えていけば良いでしょうか?
  Solaris の頃もあったのですがこちらはまだ仮運用だったのであまり気に
  していませんでした。
  File:Magic の問題かは分からないのですが、ファイルタイプの誤認?なので
  ここへ繋ぎました。
-- 
					ADVANTEST corp.
					Taiji.Can@xxxxxxxxxxxxxxxxxxx