Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [RFC]${uri}の拡張



寺西です。

# 補足です。

Tadamasa Teranishi wrote:
> 
> というような問題を回避するため、すべてデコードした eucJP で記録して、
> 表示の時はそのまま(必要に応じて漢字コードを変換)、リンク先はサーバの
> 漢字コードに変換後、uriエンコードしたものを使うということに
> しましょう。と、いう話をしているわけです。

mknmz の -U オプションは廃止し、常にデコードした eucJP で記録する
ということです。
-U オプションそのものが、便宜上つけられたものですから、上記の内容に
修正した場合、不要になります。
 
> 現状は Win32 で作ったインデックスを Linux に持ってきてもダメなん
> ですよ。

ここは嘘です。
現状は Win32 で作ったインデックスを Linux に持ってきても OK です。
こうしたいので、ちょっと変則的な uriエンコードになっているとも
言えます。

で、eucJP に変換せずに元のまま uri エンコードしたものを使うと、
ダメなんです。インデックス作成環境依存になってしまうため。

たまたま動いている UTF-8 の場合は、インデックスを作成する環境と
検索する環境が共に UTF-8 じゃないとダメです。
# UTF-8 はたまたま動いているに過ぎず、特に対応しているというような
# レベルのものではありません。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E