Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: filter/macbinary.pl試用結果



寺西です。

"Sakuma,Hiroaki" wrote:
>  
> その前に,なぜHDMLが出てくるか分からないんですが.
> HTMLとHDMLはHTMLとPDFほど違うものだと思うのですが.

そんなには違わないですがね。
同じことは XML と HTML にも言えるように思うんですが。(で、XHTML は
XML と HTML の特性をあわせたものですからね。似ているとも似ていない
とも言えるわけですわ。)

例が悪かったなら、mhonarc.pl が別フィルタにありますから、という
話に変えましょうか?

> 現実問題として,XHTMLとHTMLの区別を,File::MMagicが判別できるのでしょうか?

ドキュメントのDOCTYPEなり、<?xml ...> タグででも識別できるでしょう。

MHonArc のような先頭文字列のチェック、あるいは mknmz 側の多少の
修正で対応可能かと思います。

> XHTMLは,そういう名前のHTMLですので,ファイル種別としては text/html です.も
> ちろん,aplication/xhtml+xml という専用のmime/typeはありますが,普通は互換性
> も考えて text/html と表現します.

何が問題なのかわかりませんが、
フィルタ側で aplication/xhtml+xml として処理すればよいので、
その点は問題ないでしょう。
(あるいは text/html; x-type=xhtml とか適当に。)

# Namazu で aplication/xhtml+xml と表示されると問題?

> 他にも,Namazuの出力が未だにHTML 4.0止まりなのも,いつかは移行した方がいいで
> しょうから,ついでにXHTMLにしたらどうでしょうか?

XHTML 対応はしないといけないでしょうね。
まぁ、ついでにってほど楽じゃなさそうなんで、いつまでも HTML 4.0 
でとまっているのが現状です。
XHTML 対応するには UTF-8, UTF-16 対応が必要になりますし。
(HTML でも UTF-8 はあるのだが、XHTML のデフォルトは UTF-8 です
からね。)
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E