Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: wvWareについて



寺西です。

Ryuji Abe wrote:
> 
> On Thu, 01 May 2003 16:40:08 +0900
> Hitoshi-Ishimoto <isimotos@xxxxxxxxxxxx> wrote:
> 
> > それがですねnamazuで検索しても以下のざまなんですよ
> > ???????? (スコア: 29)
> >       著者: 不明
> >       日付: Wed, 23 Apr 2003 11:15:26
> >       ???????????????????????????? 0x08 graphic ?????????????????????????????????? 0x08 graphic 0x08 graphic 0x08 graphic 0x08 graphic 0x08 graphic 0x08
> >       graphic 0x08 graphic 0x08 graphic 0x08 graphic 0x08
> >       http://www.xxxxx.co.jp:xxxx/word/test2.doc (82432 bytes)
> 
> もしかしてこれ、HTMLとか他の形式の文書をindexingした場合でも
> こうなりませんか? もしそうであれば以下を確認してください。

著者、日付が日本語で表示されていること、
http://www.namazu.org/ml/namazu-users-ja/msg03248.html
の発言を信じると excel ではうまく検索できているようですから、
おそらく wvWare の問題かと思います。

$ wvWare -c=aaa test1.doc 

と、Linux でもデタラメな Charset 名を指定すると、漢字部分がすべて 
??????? に化けるので、これと同じことが起こっているのではないかと
思います。
(つまり、wvWare 内部の iconv の変換がうまくいっていない。)
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E