namazu-dev(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: File::MMagic



knok@xxxxxxxxxxxxx (NOKUBI Takatsugu) wrote:

>> 現在の pattern では <html lang="ja"> や <h1 id="foobar"> と
>> いった表記にマッチしません。
>(以下略)
>
>  高林さんの提案を取り込みました。"<!DOCTYPE"も削除しておきました。

ただいま確認したところ、

	 "text/html" => [ "<html[^>]>",
		     "<HTML[^>]>",
		     "<head[^>]>",
		     "<HEAD[^>]>",
		     "<body[^>]>",
		     "<BODY[^>]>",
		     "<title[^>]>",
		     "<TITLE[^>]>",
		     "<h1[^>]>",
		     "<H1[^>]>",
		     "<!DOCTYPE",

となっています。 "<!DOCTYPE" は残っていますね。それから、正
規表現
		     "<HTML[^>]>",

はダメです。

		     "<HTML[^>]*>",

であるべきです。 "[^>]" の後ろに "*" が必要です。


>  ところで、今ごろになってふと気づいたのですが、File::MMagicはGPLでは
>なく、the Apache Licenseになっています。Apacheのアーカイブに含まれる
>magic fileを借用しているためにこうなっているのですが、このような異なる
>ライセンスのソフトウェアを一つのアーカイブにまとめて配布する場合、ドキュ
>メントにその点を記しておいた方がよさそうな気がします。

README に書いておけばいいでしょう。


># 今週はちょっといろいろ忙しくてあまり時間を割けそうにないです...

うーん残念。今月末までに一通りの作業を終わらせられるといいん
だけど…。

-- Satoru Takabayashi
Code Complete を買いました (2ヶ月以内に読み切りたい)
<http://www1.fatbrain.com/asp/bookinfo/bookinfo.asp?theisbn=1556154844>