Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: filter/macbinary.pl試用結果
寺西です。
"Sakuma,Hiroaki" wrote:
>
> その前に,なぜHDMLが出てくるか分からないんですが.
> HTMLとHDMLはHTMLとPDFほど違うものだと思うのですが.
そんなには違わないですがね。
同じことは XML と HTML にも言えるように思うんですが。(で、XHTML は
XML と HTML の特性をあわせたものですからね。似ているとも似ていない
とも言えるわけですわ。)
例が悪かったなら、mhonarc.pl が別フィルタにありますから、という
話に変えましょうか?
> 現実問題として,XHTMLとHTMLの区別を,File::MMagicが判別できるのでしょうか?
ドキュメントのDOCTYPEなり、<?xml ...> タグででも識別できるでしょう。
MHonArc のような先頭文字列のチェック、あるいは mknmz 側の多少の
修正で対応可能かと思います。
> XHTMLは,そういう名前のHTMLですので,ファイル種別としては text/html です.も
> ちろん,aplication/xhtml+xml という専用のmime/typeはありますが,普通は互換性
> も考えて text/html と表現します.
何が問題なのかわかりませんが、
フィルタ側で aplication/xhtml+xml として処理すればよいので、
その点は問題ないでしょう。
(あるいは text/html; x-type=xhtml とか適当に。)
# Namazu で aplication/xhtml+xml と表示されると問題?
> 他にも,Namazuの出力が未だにHTML 4.0止まりなのも,いつかは移行した方がいいで
> しょうから,ついでにXHTMLにしたらどうでしょうか?
XHTML 対応はしないといけないでしょうね。
まぁ、ついでにってほど楽じゃなさそうなんで、いつまでも HTML 4.0
でとまっているのが現状です。
XHTML 対応するには UTF-8, UTF-16 対応が必要になりますし。
(HTML でも UTF-8 はあるのだが、XHTML のデフォルトは UTF-8 です
からね。)
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E