Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: zipフィルタ Re: lha フィルタ
寺西です。
Yukio USUDA wrote:
>
> cygwinで作成したものはunx, +lhaca で作成したものは ntf になっていました。
> ここで判別していたのですね。
はい。
> unzipの不具合ということですか。
日本語のファイル名を考慮していないということですね。
MSDOS で作られた .zip で、8bit 文字は iso8859-1 とみなし、UNIX 端末
に表示する際に不具合がでないように、わざわざコード変換するという
仕様のようです。
> 関連情報がないかと検索していたところ
> OS X で作成された .zip ファイルはファイル名が
> utf-8で入っているというような記述を見かけました。
zip ファイルを作成した環境の CodingSystem に依存するので、utf-8
になっているのは、ごく普通かと思います。
(UNIX で作れば EUC-JP になりますし。)
toeuc() で変換すれば問題はないでしょう。(nkf2.0.4 以降が必要)
> > あるいは、Perl モジュール必須にするかですね。
> > --
> Archive::ZIPだとうまくいくのですかね。
zip ファイル自体には、正しいファイル名が含まれていますので、
そのまま取り出すことが可能だろうと思います。
unzip がコード変換を行うのは、UNIX 端末に表示するために行っている
余計な処理ですので、それが含まれていることはおそらくないでしょう。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E