namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: mkmnz.pl jcode.pl patch
広瀬と申します。
<Satoru Takabayashi <ccsatoru@xxxxxxxxxxxxxxxxxx>> wrote.
/~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
>>あともう一つ理由があって、 nkf だと入力漢字コード系の統計的な自動認識
>>機能があるのですが、jcode だと最初に出て来た漢字コードになってしまうよ
>>うな気がします。
>たしか nkf は行毎にコードを認識していたと思います。 jcode.pl でも
いまでも変わってないか確認していないですが、 最初の数行を check +
変換 しながら buffer に入れておいて、統計的に見て間違えていたら
buffer の中を変換しなおす。あっていたらそのまま行く。
だった気がします。
>nkfと対等に近い速度が Perlで出せれば良いのですが、なかなか難しいよ
>うに思います。 XSのモジュールはインストールがちょっと面倒なので敬
>遠したいです。
これが標準 or 簡単にインストールできれば(Win,OS2も含めて)一番良いんで
すけどね。
># でも ISO-2022-JP -> EUC-JP と Shift_JIS -> EUC-JP の変換だけで良
># いのだから、それだけに絞った単純なコードなら案外結構速いのができ
># るかもしれない。
#古川さんに期待。。。^^; って自分でやれ > わたし
Best regards,
--
Ken-ichi Hirose (^^)k!
e-mail: hirose@xxxxxxxxxxxxxxxxxxxx