namazu-dev(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Recognize RFC document (Re: File::MMagic)



  ファイル判別テストを重ねてみました。

<199906150752.QAA24242@xxxxxxxxxxxxxx>の記事において
私は書きました。

>> 0	string		<!--\ MHonArc		text/html; x-type=mhonarc

  これは以下の間違いでした。

0	string		\<!--\ MHonArc		text/html; x-type=mhonarc


>>   問題はRFCなのですが... どういう方法で調べれば良いでしょうか? なにか
>> 良い案があれば教えてください。

  とりあえず、%SPECIALSに次のようなエントリを足して実験してみました。

		 "text/plain; x-type=rfc" => [
			      "Network Working Group",
			      "Request for Comments:",
			      "Obsoletes:",
			      "Category:",
			      "Updates:",
				   ],

  多くの場合は判別できるものの、HTML, Mail, News等に言及しているRFCに
おいてはそれらと誤認してしまうという問題が発生しています。

# ファイル名による判別も合わせて行ったほうが良いのかもしれません...
-- 
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx (private)
        nokubi@xxxxxxxxx (official)