Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: ms-word ドキュメントのヘッダ、フッタは検索対象になるのか ( ソースがついて長文です。)



Amuro Rayです。

寺西さんご指摘の、

Tadamasa Teranishi <yw3t-trns@xxxxxxxxxxxxxxx> wrote:

 
>以下のようにコメントアウトすれば、目的が果たせるかもしれません。
> 
>     {
>         my $fh = util::efopen("< $tmpfile2");
>          $$cont = util::readfile($fh);
> 
>         # Exclude wvHtml's footer becaues it has no good index terms.
> #         $$cont =~ s/<!--Section Ends-->.*$//s;
>     }


のように、コメントアウトしところ無事ヘッダー、フッターと
もインデックスにできました。
おかげさまで、助かりました。ありがとうございました。

> うーむ。メーリングリストに流すのはあまりよろしくないです。

そうですね。軽率でした。すみません。
こういう場合は、webかftpサイトにアップしておくべきなので
しょうか?(テキトーなサイトを持っていないので…。)
以後、気をつけます。

それから、wvHtmlでヘッダー、フッターをインデックスの対象
外にしているのは、どういうことなんでしょう?

検索インデックスに有効な文書は、本文に有り。

ということが考えられるのですが…。
業務文書を対象とする場合は、文書番号、文書名、登録日、担
当者など、とても大事な情報を書き込んでいることが多いと思
いますが、そのほか用途によってどのような扱いになっている
のでしょうか?



"★。、::。.::・'゜☆。.::・'゜★。、::。.::・'゜

Name   :   Amuro Ray
E-Mail  :  gundam@xxxxxxxxxxxxxxxx

"★。、::。.::・'゜☆。.::・'゜★。、::。.::・'゜