Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

ADDRESS タグからの切り出し + 属性付き BODY タグの対応



寺西です。

HTML ファイルの AUTHOR を ADDRESS タグから切り出す場合、例えば
<ADDRESS>foo</ADDRESS> ならば foo を切り出す部分があります。
この部分にタグがあると、うまく切り出せませんでした。

この不具合を修正し、commit しました。(ただし、実際に AUTHOR に登録
されるのは、foo の中のメールアドレスになります。これは現状維持。)

=====================================================================

filter/html.pl の erase_above_body() で、BODY タグより前を削除する
関数があるのですが、BODY タグに属性が付いている場合働きません。
これを修正しました。
# erase_above_body() が何故必要なのかについては理解していませんが...。

http://www.namazu.org/ml/namazu-users-ja/msg02472.html

と同じです。(ただ、'+' ではなく '*' にしましたが。)
こちらの修正も commit しました。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E