Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: 中国語、韓国語を扱う?
もろです。
『電脳中国学』なんて本を共著で書いている者です。
現状はともかく、将来的にはローカルコードを一つ一つ実装していくの
ではなく、本体は Unicode(特に UTF-8、UTF-16)にし、インデックス
を作るときには JIS や Big5 や GB などのファイルを Unicode にコン
バートしてから処理する、というのが現実的ではないでしょうか。
Microsoft Office 文書は Unicode 化してますし、XML / XHTML 文書が
増えてくると、Unicode 文書も増えてくるでしょうし。
On Tue, 10 Apr 2001 00:57:26 +0900 (JST)
hsaka@xxxxxxxxxxxxxxxxx (Hironori Sakamoto) san wrote:
> さらに、昨年 GBK に 4bytes 文字を追加
> して Unicode の上位互換とした GB18030 とよばれる*強制力*をもつ文字
> コードが制定されています。
補足ですが、GB18030 については、こういうページがあります:
http://www.jaet.gr.jp/gb18030/index.html
「強制力」の話も載っています。要するに、2001年元旦より「(中華人
民共和国)国内のあらゆる文字情報処理製品が」この規格を「採用する
よう義務づけ」られた、ということです。
Shigeki Moro
moro@xxxxxxxxxxxxxxx
http://www.ya.sakura.ne.jp/~moro/
My Public PGP Key:
http://www.ya.sakura.ne.jp/~moro/profile/pgp.html