Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: File-MMagic(OpenOfficeのfiletype)



At Thu, 04 Sep 2003 18:10:52 +0900,
Yukio USUDA wrote:
> OpenOffice1.0.x文書ファイル内にはcontent.xmlというXMLファイルがあ
> り、最初に位置する(と思っていた)ことからそれをmagic情報として
> 使っていました。
> 
> しかし、他のファイルがcontent.xmlの前にくる例があり、magic情報だ
> けでは一般のzipファイルと区別できないことがわかりました。

  ううむ、弱りましたね...

> 1はzip汎用でない中途半端なフィルターを入れることになるのと
>  (複数ファイルに展開される圧縮ファイルを通せるフィルターはいま
>   のmknmzのままでは書けないですよね)
>  OpenOfficeの文書ファイルを直接ooo.plで処理する場合と、zip用フィ
>  ルター経由で処理する2経路できて分かりにくくなる。

  HEAD では archive plugin で zip のようなファイルへの対応を考えている
ので(現状は html しかありませんが)、そのなかに持ってゆくことを考えると
これはちょっと問題がありそうです。

> 2はOpenOfficeのためだけにmknmz内の判定フローを複雑にするのは気が
>  進まない。

  現状でも結構判定フローは複雑になってる個所があります.それは MS
Office 関係のファイル群で、これらは magic(5) のレベルではどれも同一に
見えるので、しかたなく拡張子での判別を行なうことにしています。

  この辺を一般化して、特例として拡張子で判別するコードをもう少しすっき
りさせるのが筋かなあ、という気がします。

  田郷さんによると、GNOME では zip の判別を行なっていないそうです。
gnome-vfs-mime-magic より:

# Disable zip because detecting StarOffice files correctly is more imporant in the release
# than detecting the occasional zip file without an extension
#0      string          PK\003\004	application/zip
-- 
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx
	knok@xxxxxxxxxx / knok@xxxxxxxxxx