Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 言語処理に関する問題



寺西です。

Ryuji Abe wrote:
> 
> > ところで、gettext の仕様なのか、LC_CTYPE=C LC_MESSAGES=ja_JP.eucJP
> > だと、メッセージが文字化けします。
> 
> libintlはGNU libc 2.2及びGNU gettext 0.10.36から仕様がいろいろ
> 変わっていてこれもその一つなんですが、ちょっと詳細は思い出せ
> ないです。すいません。

いえいえ。

どうも、LC_MESSAGE=ja_JP.eucJP, LC_CTYPE=C だと文字化けするので、
組み合わせを考えると、
 $ env LANGUAGE=ja_JP.eucJP LC_CTYPE=en LANG=ja_JP.eucJP namazu -C 
なら、メッセージを日本語、言語処理を英語にできるようです。
(en は環境によっては en_US.XXXX 等になるのかもしれません。)

en の代わりに C を指定すると文字化けします。

文字化けと書いていますが、日本語文字列が ? で表示されるような
化け方です。(8bit 文字を? にして表示しているようにも見えます。)

ところで、C を指定する場合は
http://www.namazu.org/ml/namazu-devel-ja/msg01681.html
にあるように、LANGUAGE の扱いが少し変わっているので、更に話が
ややこしくなります。
もはや gettext 0.10.36 以降(実際には 0.13 以降ですが...。)を要求
しているので、SRPMS に入っている newgettext.patch の内容を反映し、
mknmz もそれに合わせる形で修正したいとも思うのですが、上記の話が
入ってくるといろいろ厄介ですね。

2.0.6 時代の LANGUAGE 環境変数議論を再びしないといけないのかも
しれません。
いろいろ大変そうなので、この辺りの話はゆっくり考えて対処方法を練る
ことにします。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E