Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: namazu-bugs-ja#57 の件 + TITLE="foo" のバグ他
- From: Tadamasa Teranishi <yw3t-trns@xxxxxxxxxxxxxxx>
- Date: Thu, 01 May 2003 00:18:08 +0900
- X-ml-name: namazu-devel-ja
- X-mail-count: 02899
- References: <3EA16E84.CD112DC5@asahi-net.or.jp>
寺西です。
Tadamasa Teranishi wrote:
>
> また、個人的には
> http://www.namazu.org/ml/namazu-ring/msg01326.html
> のような alt, summary, titile を切り出したくないことがありますので、
> そのような仕組みもあると良いかと思っています。
同様の内容で以下の投稿もありました。
http://www.namazu.org/ml/namazu-users-ja/msg02916.html
そこで、HTML タグの alt, summary, title 属性について、単語登録
しない機能をつけてみました。(stable-2-0 用のパッチです。)
内容)
・mknmzrc に $HTML_ATTRIBUTES を追加しました。
・$HTML_ATTRIBUTES のデフォルトは "ALT|SUMMARY|TITLE" で、
指定した HTML タグの属性は単語登録されます。
・$HTML_ATTIBUTES に ALT, SUMMARY, TITLE 以外の属性を追加しても
無視されます。
・$HTML_ATTRIBUTES から削除した属性については単語登録されません。
3つの属性全てを単語登録したくない場合は、$HTML_ATTIBUTES = '';
とします。
・$HTML_ATTRIBUTES から削除した属性については要約にも現れません。
Index: filter/html.pl
===================================================================
RCS file: /storage/cvsroot/namazu/filter/html.pl,v
retrieving revision 1.32.4.5
diff -r1.32.4.5 html.pl
104,106c104,106
< html::get_alt_attr($contref);
< html::get_table_summary($contref);
< html::get_title_attr($contref);
---
> html::get_alt_attr($contref) if "ALT" =~ /^($conf::HTML_ATTRIBUTES)$/io;
> html::get_table_summary($contref) if "SUMMARY" =~ /^($conf::HTML_ATTRIBUTES)$/io;
> html::get_title_attr($contref) if "TITLE" =~ /^($conf::HTML_ATTRIBUTES)$/io;
Index: pl/conf.pl.in
===================================================================
RCS file: /storage/cvsroot/namazu/pl/conf.pl.in,v
retrieving revision 1.33.4.4
diff -r1.33.4.4 conf.pl.in
92a93,98
> #
> # This pattern specifies attribute of a HTML tag which should be
> # searchable.
> #
> $HTML_ATTRIBUTES = 'ALT|SUMMARY|TITLE';
>
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E