Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Word、Excel文書の検索ができません。
坂野@タイムインターメディアです。
●検索結果のタイトルについて
以前、同じようなことを調べたときは、
Wordの文書をインデクシングした場合、
検索結果のファイル名には、ファイルのプロパティ情報が表示されました。
ちょっと情報が古いかもしれませんが、以下のページが役に立つかもしれません。
http://www.kabayaki.jp/manual_doc_filter.html
●ファイル名が、検索にヒットしない件
文字化けの件とも関連しているかも知れませんが、
他に、ファイル名がタイトルやuriのフィールドインデックスにあるだけで、
本文のインデックスにはないということも考えられます。
その場合は、+subject:ファイル名 等と検索式でフィールドを指定すれば
ヒットすると思います。
検索式でフィールド指定の方法について、詳しくはこちら
http://www.namazu.org/doc/manual.html#query-field
ちなみに、タイトル, uri, 本文のインデックスに単語があるかどうかは、
検索してみなくても、それぞれ、NMZ.field.subject, NMZ.field.uri, NMZ.w を見れば分かります。
インデックスの仕様についてはこちら。
http://www.namazu.org/doc/nmz.html.ja
山崎 直子 さんは書きました:
>
>はじめまして、山崎と申します。。
>初投稿ですが、よろしくお願いします。
>
>Windows2000からSamba共有がかかっているLinuxのディレクトリに
>Word2000、Excel2000で作成したファイルをコピーし、
>そのファイルに対して全文検索をかけようとしているのですが、
>うまくいきません。
>
>MSWordファイルはインデックスは作成できているのですが、
>検索結果のタイトルにファイル名でなく、
>本文が表示されてしまいます。
>また、ファイル名で検索をかけても
>ヒットしません。
>
>MSExcelファイルもインデックスは作成できるのですが、
>検索結果のタイトルが文字化けしてしまいます。
>また、ファイル名で検索をかけても
>ヒットしません。
>
>なお、テキストのインデックスは正常に作成されます。
>
>環境はこのようになっています。
>
> TurboLinux 7
> Namazu 2.0.12
> perl 5.6.1
> nkf 1.9
> Kakasi 2.3.2
> wvWare 0.7.2
> lv 4494
> xlHtml 0.4
>
>「.namazurc」にはLang jaを指定して、
>namazu.cgiと同じ場所に置いてあります。
>インデックス作成時には
>インデックスの出力先指定のオプションをつけて実行しています。
>
>
>私のやろうとしていることが元々出来ないのか、
>環境がおかしいのか、
>設定方法があるのかが分からなくて困っています。
>
>どなたかご教授いただけますでしょうか。
>よろしくお願い致します。
>
>
>Naoko Yamazaki
>
>n_yamazaki@xxxxxxxxxxx
>
>**************************************
>(株) サン・データセンター
> ネットワークプロジェクト 山崎
> n_yamazaki@xxxxxxxxxxx
>〒238-0004
>神奈川県横須賀市小川町14−1
> ニッセイ横須賀センタービル7F
> Tel 0468-24-0010(代表)
> Fax 0468-27-2878
>**************************************
>
>
================================================================
Yoh Sakano | E-Mail: sakano@xxxxxxxxxxxxx
TIME INTERMEDIA CORPORATION | TEL: 03-5362-9009
IPB Bldg. 26-27 Saka-machi | FAX: 03-5362-9008
Shinjuku-ku, Tokyo 160-0002 Japan | HP: http://www.timedia.co.jp/