Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: zipフィルタ Re:lha フィルタ



臼田です

Tadamasa Teranishi wrote:

> > # 日本語ファイル名の内部エンコードが特殊なのかな!?
> 
> ということではなくて、やはり unzip の問題でした。
> 
略
> 
> WinZip で作成した .zip ファイルの場合、
> 
> Archive:  test002.zip   8497 bytes   2 files
> -rw-rw-rw-  2.0 fat    25600 b- defN 15-May-03 04:56 aaa.doc
> -rw-rw-rw-  2.0 fat    27648 b- defN  1-Apr-03 23:42 bbb.doc
> 2 files, 53248 bytes uncompressed, 8287 bytes compressed:  84.4%
> 
> のように fat になります。UNIX だと unx になります。
> cygwin は確かめていませんが、cygwin で作成した場合には unx になる
> のではないかと思います。

cygwinで作成したものはunx, +lhaca で作成したものは ntf になっていました。
ここで判別していたのですね。

unzipの不具合ということですか。

> 改造した unzip が必須というのはあまりにきついので、
> 後ろ向きな解決方法ですが、fat と hpfs の場合は、元ファイル名を
> 使わないといった対策が現実的ではないかと思います。

関連情報がないかと検索していたところ
OS X で作成された .zip ファイルはファイル名が
utf-8で入っているというような記述を見かけました。
ファイルの展開だけならば文字コードに関係なくできそうですが、
これもやっかいな気がします。
ファイル名をcontentに含めるのは当面見送るのがよいですね。

再帰フィルタには拡張子だけ残した仮ファイル名を渡すことにしましょう。

> あるいは、Perl モジュール必須にするかですね。
> -- 
Archive::ZIPだとうまくいくのですかね。

臼田幸生