Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: UTF-8 index



寺西です。

Tadamasa Teranishi wrote:
> 
> > > それは UTF-8 化でとりあえず解決する話ですよね。
> > > (万能ではないにしろ、UTF-8 からは可逆変換可能ですから)
> >
> > UTF-8からの変換もCP932の問題で用心しないと厄介かと思います。
> 
> あるコードページの文字を UTF-8 に変換して、それを元のコードページ
> に変換した場合は、可逆変換が可能なはずです。(さすがにそれはできた
> と思う。エラー文字でない限り。違ったかな。違ったとしてもほんの一部
> の文字が問題になるだけのはず。)

と書きましたが、mknmz 側(Perl 5.8 の Encode)のテーブルと、
namazu 側(GNU libiconv ?) のテーブルに違いがあるという可能性は
ないとは言えないのかもしれません。

# 違ったら嫌だなぁ。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E