namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: はじめまして & 日本語ファイル名について(Win32)について質問します
On Sat, 28 Nov 1998 12:54:42 +0900
Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx> wrote:
> ところで、一連の話題は、
>
> http://avocado.aichi-u.ac.jp/%7Ealias/namazu/thrd13.html
>
> にて、[namazu:01163] や [namazu:01224] から始まる、話と同じでしょうか?
>
> あのときは
>
> (1) 何が問題で、
> (2) 何が解決して、
> (3) 何が未解決で、
> (4) 今回の問題とはどこが違うのか
>
> なんて分かりますでしょうか > 原さん
>
お久しぶりです。
(1)何が問題で
NT上で、日本語ファイル名(+日本語ディレクトリ?)を扱う場合、検索結果
のタイトル、抄録が文字化けしました。(エンコードとは異なる)
(2)何が解決して
上記問題が解決しました。(感謝)
(3)何が未解決で
いちおうやっつけで動かしておりますが、、、
[namazu1480]にも書きましたように、
原文書へのリンクを追加する目的で、
原文書ファイル名と変換htmlファイル名との対応関係が、
補下補下.jtd → 補下補下(jtd).html
封.xls → 封(xls).html
のようになっている状況の元で、pnamazu.pl の 検索結果出力 の $st を以下
のようにアレンジしました。
$st =~ s!(\<A HREF=\")(.*?)(%28)(\w\w\w?)(%29)(\.html?)(\">)(.*?)(</A>)
!$1.$2.$3.$4.$5.$6.$7.$8.$9."\<br> 【".$1.$2.".".$4.$7."原文書".$9.
"(".$8.".".$4.")"."】"!e;
$st =~ s!(\<A HREF=\")(.*?)(%28)(\w\w\w?)(%29)(\.txt)(\">)(.*?)
(\(\w\w\w?\)\.txt \(Text File\))(</A>)!$1.$2.$3.$4.$5.$6.$7.$8.$9.$10.
"\<br> 【".$1.$2.".".$4.$7."原文書".$10."(".$8.".".$4.")"."】"!e;
この場合、原文書のファイル名はコード化されたままなので、タイトル名+
識別子を表示して、ユーザがダウンロード時に、これを本来のファイル名の
代りにしてコード化文字列に代替できるようにしてお茶をにごしてあります。
すなわち、ここの原文書のファイル名($2)がエンコード状態であるというと
ころが問題といえば問題ですが、、、(ダウンロード時にリネームするのが
面倒だというユーザもいるにはいます)
しかし、このような使い方をしているのはいてもごく少数でしょうから、
エンコード部分まで対応してもらうのはお世話になりすぎという感がします。
(4)今回の問題とはどこが違うのか
リンク部分のファイル名がエンコードされたままなのを、文字化けととらえ
るかそうでないかというところでしょうか。
原 ( mithara@xxxxxxxxxxxxxxxx )