Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: ms-word ドキュメントのヘッダ、フッタは検索対象になるのか ( ソースがついて長文です。)
寺西です。
Amuro Ray wrote:
>
> ご指摘のwvWareのtext出力ですが、manと--helpをみるとオプ
> ション付けではなく、wvTextというスクリプトで行うようです。
>
> 結果ですが、wvTextでHTMLを作成したら問題なく、ヘッダ、フ
> ッタが含まれていました。
...
> 解決の鍵になるかわかりませんが、今の環境のWordフィルタの
> スクリプトファイルを添付しますので、引き続きご助言をお願
> いします。
うーむ。メーリングリストに流すのはあまりよろしくないです。
しかし、 おかげで解決の糸口は見つかりそうです。
> {
> my $fh = util::efopen("< $tmpfile2");
> $$cont = util::readfile($fh);
>
> # Exclude wvHtml's footer becaues it has no good index terms.
> $$cont =~ s/<!--Section Ends-->.*$//s;
> }
というところで、フッタを削除している部分があります。
(ヘッダについは不明ですが、ヘッダも削除されているのかも
しれません。)
ので、以下のようにコメントアウトすれば、目的が果たせるかもしれません。
{
my $fh = util::efopen("< $tmpfile2");
$$cont = util::readfile($fh);
# Exclude wvHtml's footer becaues it has no good index terms.
# $$cont =~ s/<!--Section Ends-->.*$//s;
}
--
寺西