Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: wvWareについて



寺西です。

Hitoshi-Ishimoto wrote:
> 
> msword.pl 1.28.4.5にすでに置き換えています
> lvも正常にはいっていると思います
> 理由は excelはうまく検索できています

うーむ。謎ですね。

> なお、Namazu では漢字コードの変換に lv を使っています。
> EUC端末で内容を確認するのであれば、
> 
> $ lv -Iu8 -Oej test1.html
> 
> とすれば漢字も読めるでしょう。(name のところは文字化けしてますけど)

これは確かめられましたか? これがダメならあきらめましょう。
Solaris の wvWare の問題 + 対象としている doc との相性かもしれません。

test1.doc をこちらの環境の Namazu で試したところ漢字も正常に表示
できました。
# ただし、mknmz 時には Invalid seek のワーニングは1回でます。
 
> これから 別のサーバで寺西様のバージョンで試してみようと思います

もはや libpng, zlib の問題が解決した以上、それは必要ないです。

そんなことをするよりは、次のことを確認しましょう。

$ wvWare test1.doc > test11.html

これが Invalid seek が出たとしても、変換した test11.htm を

$ lv -Iu8 -Oej test11.html

としてきちんと日本語表示できるならば、

$ wvWare -1 test1.doc > test12.html

で、Invalid seek が出ないかどうか確認してください。また

$ lv -Iu8 -Oej test12.html 

としてきちんと日本語表示できることを確認すると共に、Web ブラウザ
で test12.html を開き、元のワードファイルとほぼ同じものであるか
どうかを確認してください。
(ただし、図の部分は -1 オプションでばっさり切られています。)

ここまでが OK でしたら、msword.pl 1.28.4.5 の修正を行うことで、
ワーニングを出さずに mknmz および namazu で検索できるように
なると思います。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E