Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 文書フィルタに関するドキュメント



<20010707115245.EBCE4579EB@xxxxxxxxxxxxxxxxxx>の記事において
kenji@xxxxxxxxxxxxxxxxさんは書きました。

>> http://namazu.org/~kenji/dekiru-namazu-filter.txt
>> 
>> レビューしてもらえるとありがたいです。

  みてみました。

: ■文書フィルタとは何か?
: インデックス対象のファイルから必要な情報(テキスト)を抽出するための
: Perlスクリプトです。

  「スクリプト」だとそれ単独で利用可能な雰囲気があるので、「モジュール」
の方が適切な気がします。

: ●mediatype()                                   
: 処理するファイルのメディア・タイプを定義します。
                                
  「定義」よりも「返す」の方が適切ではないでしょうか。あと、次の一文も
追加した方が良いかもしれません。

: フィルタが複数のメディアタイプで定義される種類のデータに対応できる場
: 合は複数のメディアタイプを配列で返す (ex. mailnews.pl)

  加えて、メディアタイプは IANA に登録されているものを利用することが望
ましいという主旨のことも入れるべきかもしれません。

: ■mknmz と日本語処理
: mknmz は実行される際に、環境変数 $LC_ALL, $LC_CTYPE, $LANG を
: 順に調べ最初に定義されている環境変数が ja で始まっていなければ、
: 日本語処理を行わないようになっています(v 2.0.6)。

  util::islang("ja") が真を返すかどうかで、日本語処理モードにあるかど
うかを判別できるので、それについても触れた方が良いと思います。

>> add_magic() についてはよくわかってませんが、この辺の
>> ドキュメントはないですよね?

  はい、File::MMagicの多くの関数についてはまだ undocumented です... こ
れはまたまとめてなんとかしようとは思っているのですが、なかなか...
-- 
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx
	knok@xxxxxxxxxx / knok@xxxxxxxxxx