Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: はじめましてタイからの参加です。
From: knok@xxxxxxxxxxxxx (NOKUBI Takatsugu)
Subject: [namazu-users-ja] Re: はじめましてタイからの参加です。
Date: Thu, 6 Sep 2001 15:53:36 JST
> しかし、今ちょっと tis620 のコード表をみてみたのですが、この予想は正
> しくなかったようです ^^; 0x00-0x7f は ASCII と同じようでした。
そうです。タイ文字にはアルファベットの大文字小文字のようなものはな
いので、いわゆる1バイトカナみたいなもんですか。子音文字44個、上下
左右につく母音文字、それに4個の声調記号、黙字記号などだそうですが。
いちおう、環境変数は疑ってみる方がいいかもしれません。LANG=th_TH
のときはできるだけヘンな処理をしないようにしたつもりですが、むろん
見落としがあるんだろうとおもいます。もうちょっと調べたいところです
が、いまは時間が取れずにいます。すみません。
> >> マルティリンガルを目指すなら、Unicodeへの対応が必要だと感じ
> >>ます。開発版の方がどのようになっているかは分かりませんが、近
> >>い将来、Unicodeに置き換わることは他のプログラムを見ていても目
> >>に見えています。
>
> 検索は言語に依存した処理も多くあるので、encoding 以外にも障害はいろ
> いろあるだろうとは予測しています。Unicode (version 3?)だけで解決できな
> い問題もあるでしょうし、それらも含めてどうすべきかは今後とも検討してい
> かなければならないと思っています。
同感です。たとえば内部エンコーディングを Unicode にすればいくつか
のマイナーな問題は解決できるのかもしれませんが、別の新たなマイナー
な問題も出てくるでしょうし、そもそも本質的に、Unicode にしさえすれ
ば万事が解決、というほどには単純ではないだろうと言う気はしています。
--
馬場 肇 ( Hajime BABA ) E-mail: hajime.baba@xxxxxxxxx
国立天文台 天文学データ解析計算センター
--