Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [RFC]${uri}の拡張



寺西です。

Yukio USUDA wrote:
> 
> 3.については全く考えていなかったので一度eucに統一してしまう際に変換が不
> 可逆な文字を含むuriに影響があるのではと思っていました。

ないとは言えません。特に機種依存文字。
# これが UTF-8 になるとマシになりますかね。

元の文字を残したいのは、この点が心配だからですね。それはわかります。

ま、特殊な文字は捨ててしまうという対応でも、十分実用的ではないかと
いうところが、eucJP に統一するという話の前提になっています。

> Samba,WebDAV等でファイルを行き来させたときに不可逆な文字コード変換がないの
> (仕様として無視できる範囲)であればeuc(もしくはutf-8ですか)に統一してし
> まう案のほうがNMZ.field.uriを2重化させなくてすむのでよいと思います。
> namazuにしっかりした文字コード変換機能がついたほうがよいのでいわきりさんの
> 実装で実現されるのを期待しています。

私も。
 
> 余談ですが
> NMZ.rという元の文字コードのままのファイル名が入っているファイルもあり、
> 作業log以外に使われていないので有効活用する方法はないですかね。

NMZ.r はかなり異様なファイルだと思います。
インデックスの update 時にはこのファイルを読み込んで処理を行うのが
また凄いところです。(削除ファイルの検知に利用している!?)
# というわけで、ここも eucJP じゃないとまずいかな。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E