Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: 要約にsubjectを含まない方法-具体的な記述方法?
- From: Tadamasa Teranishi <yw3t-trns@xxxxxxxxxxxxxxx>
- Date: Tue, 07 Oct 2003 17:45:37 +0900
- X-ml-name: namazu-users-ja
- X-mail-count: 03542
- References: <00f001c38ca0$f514c160$0301a8c0@akira1>
寺西です。
Acclub wrote:
>
> > ここでは HTML についての改造方法を示します。
> > html.pl の weight_element() で $$headings に追加する部分を改造
> > すれば良いでしょう。$element が TITLE なら追加しないという処理を
> > 加えれば目的は果たせるものと思います。
嘘でした。
ちょっとテストしたところ、根っこが深くて簡単には改造できそうに
ありませんでした。
そもそも subject(TITLE) の文字列は summary には含まれていませんでした。
# これは、そうあるべきです。
> 2. Namazu: FAQ (スコア: 87)
> 著者: webmaster@xxxxxxxxxx
> 日付: Fri, 30 Nov 2001 19:12:17
> Namazu: FAQ 目次 Namazu 2.0に関するよくある質問、ありそうな質問と
と subject の文字列が summary に含まれるのは、subject と同じ文字列
が本文に含まれているためでした。
本文に含まれる文字列は <H1> タグで囲まれているので
--no-heading-summary で削除できそうに思いますが、そうはいかない
のです。
内部的には summary は、$heading と $contref を繋いだ文字列の
先頭部分です。--no-heading-summary をつけると、$heading に
問題の文字列は含まれませんが、$contref に含まれるため、
結果として summary に現れます。
<H*> タグで囲まれた文字列を $contref に含めないようにすることで、
summary から消すことはできますが、検索対象からも外れてしまいます。
そのため、この対処方法もあまり良いものではありません。
> フィルタの改造で対応が可能とのこと、希望が沸いてきました。
変に期待を持たせてすみません。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E