Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Word ・ Excel のインデックスがうまくできない
- From: <zyoru@xxxxxxxxxxxxxx>
- Date: 18 Sep 2003 17:24:17 +0900
- X-ml-name: namazu-users-ja
- X-mail-count: 03525
紹介が送れて申し訳ありません、志和ともうします。
改めてよろしくお願いします
yw3t-trns@xxxxxxxxxxxxxxx wrote:
> この症状は初耳です。
>
> mknmz -C を実行すると、どのような結果が表示されますか?
mknmz -Cを実行した結果は以下の通りでした
システム: linux
Namazu: 2.0.12
Perl: 5.006
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
ChaSen: module_chasen -j -F '%m '
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP,EUC-JP
言語: ja_JP,EUC-JP
文字コード: euc
CONFDIR: /usr/local/etc/namazu
LIBDIR: /usr/local/etc/namazu/pl
FILTERDIR: /usr/local/share/namazu/filter
TEMPLATEDIR: /usr/local/share/namazu/template
対応メディアタイプ:
application/excel
application/msword
application/powerpoint
application/x-gzip
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; x-type=rfc
>
> 本件と直接関係ないことですが、
> nkf 2.0 はやめましょう。nkf 1.71 か nkf 2.02 以降をご使用ください。>
ご指摘の通り、新しくnkf2.02に入れ替えました。どうもありがとうございます
>
> wvWare 0.7.2 というのが微妙ですが、たぶん 0.7.2 までは Namazu 2.0.12
> はサポートしていたと思います。
>
> % wvWare test.doc | lv -Iu8 -Oej > word.html
>
> と Namazu を通さず、wvWare で処理した word.html は期待した結果
> が得られているでしょうか。まずは、それを確認してください。
>
> 同様に excel の方も以下の結果を確認してください。
>
> % xlhtml -m test.xls | lv -Iu8 -Oej > excel.html
>
wvWare,xlhtmlで処理した結果、どちらのHTMLファイルも元のWordとExcelの文書で入力
した部分が文字化けを起こしていました(両方ともUTF-8で出力されたのと何か関係があ
るかも知れません…)
これをヒントにもう少し調べてみようと思います、本当にどうもありがとうございます