Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Word ・ Excel のインデックスがうまくできない



紹介が送れて申し訳ありません、志和ともうします。
改めてよろしくお願いします

yw3t-trns@xxxxxxxxxxxxxxx wrote:
> この症状は初耳です。
> 
> mknmz -C を実行すると、どのような結果が表示されますか?

mknmz -Cを実行した結果は以下の通りでした

システム: linux
Namazu: 2.0.12
Perl: 5.006
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
ChaSen: module_chasen -j -F '%m '
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP,EUC-JP
言語: ja_JP,EUC-JP
文字コード: euc
CONFDIR: /usr/local/etc/namazu
LIBDIR: /usr/local/etc/namazu/pl
FILTERDIR: /usr/local/share/namazu/filter
TEMPLATEDIR: /usr/local/share/namazu/template
対応メディアタイプ: 
  application/excel
  application/msword
  application/powerpoint
  application/x-gzip
  message/news
  message/rfc822
  text/hnf
  text/html
  text/html; x-type=mhonarc
  text/plain
  text/plain; x-type=rfc
> 
> 本件と直接関係ないことですが、
> nkf 2.0 はやめましょう。nkf 1.71 か nkf 2.02 以降をご使用ください。>

ご指摘の通り、新しくnkf2.02に入れ替えました。どうもありがとうございます

> 
> wvWare 0.7.2 というのが微妙ですが、たぶん 0.7.2 までは Namazu 2.0.12
> はサポートしていたと思います。
> 
> % wvWare test.doc | lv -Iu8 -Oej > word.html
> 
> と Namazu を通さず、wvWare で処理した word.html は期待した結果
> が得られているでしょうか。まずは、それを確認してください。
> 
> 同様に excel の方も以下の結果を確認してください。
> 
> % xlhtml -m test.xls | lv -Iu8 -Oej > excel.html
> 
wvWare,xlhtmlで処理した結果、どちらのHTMLファイルも元のWordとExcelの文書で入力
した部分が文字化けを起こしていました(両方ともUTF-8で出力されたのと何か関係があ
るかも知れません…)

これをヒントにもう少し調べてみようと思います、本当にどうもありがとうございます