Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: 文書フィルタに関するドキュメント
- From: knok@xxxxxxxxxxxxx (NOKUBI Takatsugu)
- Date: Tue, 10 Jul 2001 14:06:11 JST
- X-ml-name: namazu-devel-ja
- X-mail-count: 01581
<20010707115245.EBCE4579EB@xxxxxxxxxxxxxxxxxx>の記事において
kenji@xxxxxxxxxxxxxxxxさんは書きました。
>> http://namazu.org/~kenji/dekiru-namazu-filter.txt
>>
>> レビューしてもらえるとありがたいです。
みてみました。
: ■文書フィルタとは何か?
: インデックス対象のファイルから必要な情報(テキスト)を抽出するための
: Perlスクリプトです。
「スクリプト」だとそれ単独で利用可能な雰囲気があるので、「モジュール」
の方が適切な気がします。
: ●mediatype()
: 処理するファイルのメディア・タイプを定義します。
「定義」よりも「返す」の方が適切ではないでしょうか。あと、次の一文も
追加した方が良いかもしれません。
: フィルタが複数のメディアタイプで定義される種類のデータに対応できる場
: 合は複数のメディアタイプを配列で返す (ex. mailnews.pl)
加えて、メディアタイプは IANA に登録されているものを利用することが望
ましいという主旨のことも入れるべきかもしれません。
: ■mknmz と日本語処理
: mknmz は実行される際に、環境変数 $LC_ALL, $LC_CTYPE, $LANG を
: 順に調べ最初に定義されている環境変数が ja で始まっていなければ、
: 日本語処理を行わないようになっています(v 2.0.6)。
util::islang("ja") が真を返すかどうかで、日本語処理モードにあるかど
うかを判別できるので、それについても触れた方が良いと思います。
>> add_magic() についてはよくわかってませんが、この辺の
>> ドキュメントはないですよね?
はい、File::MMagicの多くの関数についてはまだ undocumented です... こ
れはまたまとめてなんとかしようとは思っているのですが、なかなか...
--
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx
knok@xxxxxxxxxx / knok@xxxxxxxxxx