Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 要約生成時、HTML内の対象範囲を指定出来ますか?



寺西です。

haru_zou@xxxxxxxxxxxx wrote:
> 
> mknmzで生成される要約ですが、HTMLファイル内の対象範囲を
> 指定することは可能でしょうか?

簡単ではないですね。

検索対象の先頭*1の一部が要約に使われているので、要約と検索対象を別々
に管理することができません。

*1 --no-heading-summary は必須

> 例えば、<!-- [BODY] -->......<!-- /[BODY] -->など。
> 
> 確か、オプションでは設定出来ないと思います。
> 何か良い方法を教えてください。

<!-- [BODY] -->......<!-- /[BODY] --> 
の範囲のみを検索対象にするのなら、html.pl でこの範囲以外をカットする
処理を加えれば、要約もこの範囲(この範囲の先頭部分)に限定されます。
# 当然、この範囲外の文字列で検索することはできなくなりますが...。

そこで、2PASS で処理しても良いのなら、次の方法で何とかごまかすことは
できるかもしれません。

1回目は、上記の修正した html.pl フィルタを使ってインデックスを
作成します。そして要約ファイルである 
NMZ.field.summary と NMZ.field.summary.i を保存します。
2回目は、通常の mknmz でインデックスを作成します。先に保存した
要約ファイルをコピーして、検索にはこのインデックスファイルを
使用します。

多少手間ですが、こうすれば目的がはたせるのではないかと思います。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E