Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: filter/macbinary.pl試用結果
寺西です。
# 何だかんだ書きましたが、結局こうでした。
Tadamasa Teranishi wrote:
>
> 一方、空要素の <meta />, <br />, <hr />, <img /> といった、XHTML
> タグについては、W3C の仕様書で後方互換性を保つ為に示されているもの
> で、HTML 解釈ブラウザのためにそう書くことになっています。
...
> このため、HTML を解釈する部分ではこれらのタグに対応しておかない
> といけないのは確かです。(これを解釈しないからといって、たぶんバグ
> とは言えないとは思いますが、実用的ではないでしょう。)
少なくとも開発版では <br /> や <img /> は削除されるようです。
つまり、既に対応済みでした。
きちんと確認していませんが、remove_html_elements の前の処理である
normalize_html_element でうまく normalize されて、
remove_html_elements で削除されるようです。
(<br/> はダメですが、これは HTML 解釈ブラウザで解釈されないと
されているので、HTML 解釈ブラウザと同じ振る舞いといえるでしょう。)
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E