Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

ms-word ドキュメントのヘッダ、フッタは検索対象になるのか



どうも、Amuro Rayです。

お世話になります。


Namazu+wvWare+lvを使ってMs-Word文書を検索対象に使ってい
ます。

そこでの疑問なんですが、Wordドキュメント内の「ヘッダ」
「フッタ」に記述される文字は、Namazuとしてインデックスの
対象になるのでしょうか?


○調べたこと
ヘッダ、フッタ、本文にキーワードを入れたword文書を作成。
wvWare+lvをコマンドラインでhtml化。
生成されたhtmlを参照。ヘッダ、フッタ、本文とも同様のhtml
記述がされていることを確認した。

Namazuインデックスを作成。NMZ.wを参照したが、ヘッダ、フ
ッタのキーワードは見つからなかった。
当然Namazuの検索対象にはならず、検索結果には現れなかった。
(本文キーワードではヒット)


○推測
wvWareの仕様と考えたが、htmlの記述は同様なのでwvWareが原
因ではなさそう。

lvは、コードUTF-8からeuc-jaの変換しかしていないので、こ
れも対象ではないと思う。

mknmzでも、ヘッダ、フッタの区別の仕様がないのだけれど、
ここからヘッダ、フッタのキーワードがなくなっている???


ヘッダに検索対象になるキーワードを使っているので、現在ほ
とんど検索対象になりえていないのです。


どなたかご助言をいただけないでしょうか?
よろしくお願いします。


仕様環境
OS TurboLinux7
Namazu 2.0.5
wvWare 0.6.7
lv 4.49.4



"★。、::。.::・'゜☆。.::・'゜★。、::。.::・'゜

Name   :   Amuro Ray
E-Mail  :  gundam@xxxxxxxxxxxxxxxx

"★。、::。.::・'゜☆。.::・'゜★。、::。.::・'゜