Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
MS-Wordファイル名でHitせず
- From: Seto <seto@xxxxxxxxx>
- Date: Tue, 01 Oct 2002 18:24:05 +0900
- X-ml-name: namazu-users-ja
- X-mail-count: 02837
再びSetoです。
件名の事で悩んでおります。(悩んでばかりですが)
検索用ディレクトリに MS-WordとMS-Excelのファイルを設置。
インデックスディレクトリにて mknmz /xxxx/xxxx/* <−− target path
して namazu.cgiにて検索を試みるのですが
Wordファイルについて検索キーとして
文書内の文字列を与えるとHitしてくれますが
ファイル名を与えてもHitしてくれません。
XXXX.doc に対して 'XXXX' でも 'doc' でもHitしません。
ファイル名がEUC日本語でも英数のみでも現象同じです。
同じ事をMS-Excelファイルで行うと 文書内(表内?)の文字列でも
ファイル名でもHitしてくれます。
YYYY.xls に対して 'YYYY' でも 'xls' でもHitします。
各フィルターの導入は以下のように行いました。
Wordについて
http://prdownloads.sourceforge.net/wvware/のミラーから
wv-0.7.2.tar.gzを ダウンロード
tar xzf wv-0.7.2.tar.gz
cd wv-0.7.2
./configure
make
make install
Excelについて
xlhtml-0.4.tar.gz をダウンロードする。
tar xzf xlhtml-0.4.tar.gz
cd xlhtml-0.4
./configure
make
make install
当然かもしれませんが mknmz後の NMZ.w には 'YYYY','.xls'は存在しますが
'XXXX' も '.doc' も存在しません。
どのあたりを確認すべきかアドバイスお願いいたします。
既にNMZ.wに無いのだから関係ないと思いますが
CGI用ディレクトリにある
.namazurcの設定は
Lang ja_JP.eucJP
最後になってしまいましたが使用環境は
Redhat7.3 + Apache1.3.23
namazu-2.0.12
kakasi-2.3.4
nkf-1.92-6
lv-4.49.4-3
seto@xxxxxx .jp