Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: 全角半角変換
- From: Dan Kogai <dankogai@xxxxxxxxx>
- Date: Wed, 4 Jun 2003 14:38:39 +0900
- X-ml-name: namazu-devel-ja
- X-mail-count: 02943
弾です。みなさんはじめまして、Perl5.8のEncodeをメンテしてます。あと最近 Text::Kakasi のメンテも引き継ぎました。
http://search.cpan.org/dist/Encode/
http://search.cpan.org/dist/Text-Kakasi/
それで本題です。
On Wednesday, June 4, 2003, at 01:23 PM, Tadamasa Teranishi wrote:
> nkf 相当の変換が必要なんだろうとは思います。ただ、
> EUC になったものを nkf で変換するのは無理みたい
> (EUC半角カナ を入力すると、無視される)
> ですので、Unicode から SJIS に変換した後、toeuc で EUC に変換
> するといった面倒なことになるのかもしれません。
実は Perl 5.8 なら、CP932 から Unicode
への変換、機種依存文字の全角/半角化、そしてそれをEUC-JPに落とすということが同一の Perl Script の中で全てできます。
これを利用したちょっとした Hook が、 Text::Kakasi 2.04 に入っているので参照してみてください。
これを利用すれば、NamazuのindexそのものをUTF-8で作るということも可能なはずで、暇があれば取り組んでみたいのですがちょっと手いっ
ぱいで....
Dan the Man with Too Many Projects to Manage