Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [RFC]${uri}の拡張
寺西です。
# 補足です。
Tadamasa Teranishi wrote:
>
> というような問題を回避するため、すべてデコードした eucJP で記録して、
> 表示の時はそのまま(必要に応じて漢字コードを変換)、リンク先はサーバの
> 漢字コードに変換後、uriエンコードしたものを使うということに
> しましょう。と、いう話をしているわけです。
mknmz の -U オプションは廃止し、常にデコードした eucJP で記録する
ということです。
-U オプションそのものが、便宜上つけられたものですから、上記の内容に
修正した場合、不要になります。
> 現状は Win32 で作ったインデックスを Linux に持ってきてもダメなん
> ですよ。
ここは嘘です。
現状は Win32 で作ったインデックスを Linux に持ってきても OK です。
こうしたいので、ちょっと変則的な uriエンコードになっているとも
言えます。
で、eucJP に変換せずに元のまま uri エンコードしたものを使うと、
ダメなんです。インデックス作成環境依存になってしまうため。
たまたま動いている UTF-8 の場合は、インデックスを作成する環境と
検索する環境が共に UTF-8 じゃないとダメです。
# UTF-8 はたまたま動いているに過ぎず、特に対応しているというような
# レベルのものではありません。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E