Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: mhoarc/iso2022jp.pl
寺西です。
藤原 誠 / Makoto Fujiwara wrote:
>
> mhoarch の iso2022jp.pl の < > & を < > & に符号化す
> るという方針は間違っているのではないか
> と思っています。( もちろん ESC $ B... ESC の (J の中の話です)
> text/html; charset=iso-2022-jp とした場合、これらは生で置いて
> おいていい
> と思うのは間違いですか ?
iso2022jp の文字の中の < を < に置換するのは間違いです。
そして、MHonArc の設定が悪いと置換してしまいます。
しかし、適切に設定を行うと iso2022jp 文字の中の < は < に
置換されません。
そしてその適切な設定の例が
http://www.namazu.org/ml/namazu-devel-ja/msg02915.html
であり、これを使うことによってタイトルの文字化け問題は
解決します。(少なくとも 2.6.3 では)
なお、iso2022jp.pl で < > & を < > & に符号化すること
自体は問題ではありません。というよりしなければなりません。
これらが漢字コードの一部として現れたときにはしてはいけませんが、
半角文字として現れた時には変換しなければならないためです。
iso2022jp の文字の中の < を < に置換する問題は、iso2022jp.pl
の処理ではなく、別のところで起こります。(iso2022jp の文字列を
iso2022jp だとは認識しないために起こります。)
> やはり一度 euc にして、最後はそのまま出すか、iso-2022-jp に揃
> えるのかなという理解です。( multi-lingual にはなりませんが)。
いえ、適切に設定すれば問題ないはずです。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E