Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: ms-word ドキュメントのヘッダ、フッタは検索対象になるのか ( ソースがついて長文です。)
- From: Amuro Ray <gundam@xxxxxxxxxxxxxxxx>
- Date: Mon, 04 Feb 2002 20:20:08 +0900
- X-ml-name: namazu-users-ja
- X-mail-count: 02423
- References: <3C595F57.F6A509F7@asahi-net.or.jp>
Amuro Rayです。
寺西さんご指摘の、
Tadamasa Teranishi <yw3t-trns@xxxxxxxxxxxxxxx> wrote:
>以下のようにコメントアウトすれば、目的が果たせるかもしれません。
>
> {
> my $fh = util::efopen("< $tmpfile2");
> $$cont = util::readfile($fh);
>
> # Exclude wvHtml's footer becaues it has no good index terms.
> # $$cont =~ s/<!--Section Ends-->.*$//s;
> }
のように、コメントアウトしところ無事ヘッダー、フッターと
もインデックスにできました。
おかげさまで、助かりました。ありがとうございました。
> うーむ。メーリングリストに流すのはあまりよろしくないです。
そうですね。軽率でした。すみません。
こういう場合は、webかftpサイトにアップしておくべきなので
しょうか?(テキトーなサイトを持っていないので…。)
以後、気をつけます。
それから、wvHtmlでヘッダー、フッターをインデックスの対象
外にしているのは、どういうことなんでしょう?
検索インデックスに有効な文書は、本文に有り。
ということが考えられるのですが…。
業務文書を対象とする場合は、文書番号、文書名、登録日、担
当者など、とても大事な情報を書き込んでいることが多いと思
いますが、そのほか用途によってどのような扱いになっている
のでしょうか?
"★。、::。.::・'゜☆。.::・'゜★。、::。.::・'゜
Name : Amuro Ray
E-Mail : gundam@xxxxxxxxxxxxxxxx
"★。、::。.::・'゜☆。.::・'゜★。、::。.::・'゜