Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: File::Magicでの挙動
菅です。
Mac の pdf ではないのですが、時として *.doc もかなり 未対応の形式 になって
しまいます。パスの途中で日本語のpath(%B5....) 等の場合だけかと思って
いましたが、そうでもないようです。
#日本語パス名が入っていても出来て良いように思いますし。。
あるファイルが 未対応 となったので、直接調べてみると、
% wvVersion /XX/XXXXX/XXX/aa.doc
Version: word8 or higher, Encrypted: No
% wvhtml /XX/XXXXX/XXX/aa.doc aa.html
% nkf -e aa.html |more
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http://www.w3.or
g/TR/REC-html40/loose.dtd">
<html>
<head>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=UTF-8">
<META NAME="GENERATOR" CONTENT="wvWare/wvWare version 0.7.6">
<title>
:
:
と、言う感じでちゃんと出来ていそうな気がするのですが判定では 未対応 と
なるので、index 化されていないと思われます。先日の判定に使用した
File スクリプトでの判断でも application/msword と、なります。
このような場合の対処はどのように考えていけば良いでしょうか?
Solaris の頃もあったのですがこちらはまだ仮運用だったのであまり気に
していませんでした。
File:Magic の問題かは分からないのですが、ファイルタイプの誤認?なので
ここへ繋ぎました。
--
ADVANTEST corp.
Taiji.Can@xxxxxxxxxxxxxxxxxxx