Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: UTF-8 index
寺西です。
Yukio USUDA wrote:
>
> > nkf(1) より:
> > -x 通常おこなわれるX0201仮名->X0208の仮名変換をしないで、
> > X0201仮名を保存する。入力は、MS-Kanjiの1byte仮名、SO/SI、
> > ESC-(-I, SSOを受け付ける。出力は、日本語EUC中ではSSO、
> > JISでは ESC-'('-I を使う。
> >
> -xオプションを試したところ期待通りの動作をしました。
> ファイル名を変換するときは"mXZ1"のかわりに"x"をつけて変換するように
> すれば半角カナ問題はとりあえずは解決ですね。
手元の環境ではうまく動いていないのですが、何か私勘違いしていますかね。
(以下テストした内容です。"カタカナ" は半角です。)
$ echo "カタカナ" | nkf -xs | od -t xCa
0000000 8e b6 8e c0 8e b6 8e c5 0a
so 6 so @ so 6 so E nl
$ echo "カタカナ" | iconv -f eucjp -t sjis | od -t xCa
0000000 b6 c0 b6 c0 b6 c5 0a
6 @ 6 @ 6 E nl
0000007
余計な 8e が入っているように見えます。
# これは 2.04 で直っているのかもしれないし、直してもらえる可能性は
# 高いのかもしれませんが。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E