namazu-dev(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: filters



<200002060206.LAA04804@xxxxxxxxxxxxxx>の記事において
satoru-t@xxxxxxxxxxxxxxxxxxさんは書きました。

>>   * pre_codeconv()
>>     - フィルタ処理の前にコード変換が必要
>> 
>>   * post_codeconv()
>>     - フィルタ処理の後にコード変換が必要
>> 
>> あるいは、[namazu 1374] で示したように pdf.pl 内でコード変換
>> を行ってもいいんですが、どちらがいいでしょう?

  pre/post で処理する方が良いように思います。

  ところで、msword.pl は内部で lv を読んで UTF8 -> EUC-JP への変換を行
なっているので、これも一緒にどうにかしたいところです。

  コード変換に関しては、

* jcode.pl
* Jcode.pm
* NKF.pm
* nkf (command)
* lv (command)

  あたりの存在を実行時に調べて適切なものを自動的に使いわけられるように
できないかと思うのですが、いかがでしょうか。

# 同様に kakasi/chasen も...

>> それから、filter/*.pl に
>> 
>>   * magic_entry()
>>     - File::MMagic用の情報を追加する

  賛成です。
-- 
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx (private)
        nokubi@xxxxxxxxx (official)