Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Word ・ Excelのインデックスがうまくできない
寺西です。
zyoru@xxxxxxxxxxxxxx wrote:
>
> 現在LinuxでNAMAZUを利用してWord、Excel、PDFファイルの全文検索を行える
> ようにしているのですが、WordとExcelのファイルがうまく検索できない状況
> で困っています。(具体的には、Wordの一行目以降と、Excelの1列目以降の文
> 章が検索できないです)
この症状は初耳です。
mknmz -C を実行すると、どのような結果が表示されますか?
# doccat の評価版が使われているのなら、このような症状がでるかもしれ
# ませんが、wvWare, xlHtml がインストールされている環境では
# 起こらないはず。
> Linux : Kondara Linux 2.1
> Namazu : 2.0.12
> perl : 5.006
> nkf : 2.0
本件と直接関係ないことですが、
nkf 2.0 はやめましょう。nkf 1.71 か nkf 2.02 以降をご使用ください。
> Kakasi : 2.3.4
> wvWare : 0.7.2
> lv : 4495
> xlHtml : 0.5.1
wvWare 0.7.2 というのが微妙ですが、たぶん 0.7.2 までは Namazu 2.0.12
はサポートしていたと思います。
% wvWare test.doc | lv -Iu8 -Oej > word.html
と Namazu を通さず、wvWare で処理した word.html は期待した結果
が得られているでしょうか。まずは、それを確認してください。
同様に excel の方も以下の結果を確認してください。
% xlhtml -m test.xls | lv -Iu8 -Oej > excel.html
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E