namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: mkmnz.pl jcode.pl patch



広瀬と申します。

 <Satoru Takabayashi <ccsatoru@xxxxxxxxxxxxxxxxxx>> wrote.
/~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
>>あともう一つ理由があって、 nkf だと入力漢字コード系の統計的な自動認識
>>機能があるのですが、jcode だと最初に出て来た漢字コードになってしまうよ
>>うな気がします。
>たしか nkf は行毎にコードを認識していたと思います。 jcode.pl でも

いまでも変わってないか確認していないですが、 最初の数行を check +
 変換 しながら buffer に入れておいて、統計的に見て間違えていたら 
buffer の中を変換しなおす。あっていたらそのまま行く。

だった気がします。

>nkfと対等に近い速度が Perlで出せれば良いのですが、なかなか難しいよ
>うに思います。 XSのモジュールはインストールがちょっと面倒なので敬
>遠したいです。

これが標準 or 簡単にインストールできれば(Win,OS2も含めて)一番良いんで
すけどね。 

># でも ISO-2022-JP -> EUC-JP と Shift_JIS -> EUC-JP の変換だけで良
># いのだから、それだけに絞った単純なコードなら案外結構速いのができ
># るかもしれない。

#古川さんに期待。。。^^;  って自分でやれ > わたし

   Best regards,
--
Ken-ichi Hirose (^^)k!
e-mail: hirose@xxxxxxxxxxxxxxxxxxxx