Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 要約にsubjectを含まない方法-解決



いろいろとありがとうございました。
Subjectと同じ語句を見出しに使用しているため、
このような現象が生じるんですね。

もっとじっくり見極めるべきでした。


> 寺西です。
>
> Acclub wrote:
> >
> > > ここでは HTML についての改造方法を示します。
> > > html.pl の weight_element() で $$headings に追加する部分を改造
> > > すれば良いでしょう。$element が TITLE なら追加しないという処理を
> > > 加えれば目的は果たせるものと思います。
>
> 嘘でした。
> ちょっとテストしたところ、根っこが深くて簡単には改造できそうに
> ありませんでした。
>
> そもそも subject(TITLE) の文字列は summary には含まれていませんでした。
> # これは、そうあるべきです。
>
> > 2. Namazu: FAQ (スコア: 87)
> > 著者: webmaster@xxxxxxxxxx
> > 日付: Fri, 30 Nov 2001 19:12:17
> > Namazu: FAQ 目次 Namazu 2.0に関するよくある質問、ありそうな質問と
>
> と subject の文字列が summary に含まれるのは、subject と同じ文字列
> が本文に含まれているためでした。
>
> 本文に含まれる文字列は <H1> タグで囲まれているので
> --no-heading-summary で削除できそうに思いますが、そうはいかない
> のです。
>
> 内部的には summary は、$heading と $contref を繋いだ文字列の
> 先頭部分です。--no-heading-summary をつけると、$heading に
> 問題の文字列は含まれませんが、$contref に含まれるため、
> 結果として summary に現れます。
>
> <H*> タグで囲まれた文字列を $contref に含めないようにすることで、
> summary から消すことはできますが、検索対象からも外れてしまいます。
> そのため、この対処方法もあまり良いものではありません。
>
> > フィルタの改造で対応が可能とのこと、希望が沸いてきました。
>
> 変に期待を持たせてすみません。
> -- 
> =====================================================================
> 寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
> http://www.asahi-net.or.jp/~yw3t-trns/index.htm
> Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E
>
>