namazu-dev(ring)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: File::MMagic
knok@xxxxxxxxxxxxx (NOKUBI Takatsugu) wrote:
>> なるコードが見つかりましたが、この 2つは区別しないで
>> text/rfc822 にまとめてしまえばいいんじゃないでしょうか?
>
> うーん、IANAに登録されているmedia typeはrfc822とnewsに分けてあるので、
>できれば種別としては分けておきたいです。File::MMagic自体はNamazu専用と
>いうわけではなく、一般的なmedia typeを返すようにしたいので...
なるほど。では Namazu側で rfc822 と news を同一視することにします。
># そんなわけで、これをCPANに登録してみました。
お、いいですね。海外の方からの反応はありました?
>> # .tar.gz を扱えると嬉しいかな? 検索結果は
>> # /somewhere/foo.tar.gz#filename みたいな感じで出力する仕様
>> # にして。これができるなら HTML の <a name="foo"> にも対応で
>> # きると思う。 (実装はちと難しそうですが)
>
> これは私もちょっと考えました ^^; ただ、これはフィルタ処理の範疇では
>なく、ファイル以外のデータを検索対象にする仕組みが必要だと思います。
あ、そういえばそういう話がありましたね。忘れていました。
> こちらについてはまだあまり考えがまとまっていないのですが、とりあえず
>
>・データの指示方法
> (URI的な指示方法が良い?)
これがよいでしょう。 (http|ftp|news):// はすべて lynx -dump
に任せればよいですね。リストを mknmz -F に渡す形式で対応すれ
ばよいかな。再帰的な取得は考えなくてもよいでしょう、面倒だか
ら。 (あらかじめ wget なりで取得しておきましょう)
> File::MMagic::checktype_filenameはちょっと使えないかもしれません。手
>元のバージョンではchecktype_contentsという関数も実装したので、そちらが
>使えるでしょう。
了解しました。
p.s.
今日は [namazu-dev 17] の実装に取り組むつもりです。
-- Satoru Takabayashi