namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Plan for Namazu next version
Fri, 30 Jan 1998 02:51:24 +0900 頃の
Mail-Count: 00069
Subject: [namazu:00069] Re: Plan for Namazu next version
についてのお話にて Satoru Takabayashi さん曰く…
(S == Satoru Takabayashi <ccsatoru@xxxxxxxxxxxxxxxxxx> さん)
>> これだと長い文字列が MIME エンコードされた場合など
>> エンコード文字列が適当に分割されているケースで
>> 問題になりませんかね?
In article 00069, <199801291754.CAA06530@xxxxxxxxxxxxxxxxxx>
S> うーむ。ちょっと問題ありますね。修正するとすれば
S>
S> my ($str) = @_;
S> $str =~ s/^[ \t]+//mg;
S> $str =~ s/[\r\n]+//g;
S> $str =~ s/=\?ISO-2022-JP\?B\?(.*?)=\?=/decode_base64($1)/gei;
S>
S> かな。
$str になにが渡ってくるのかにもよりますが
ABCdef ghiJKL
みたいのは
=?ISO-2022-JP?B?ABC?= def ghi =?ISO-2022-JP?B?JKL?=
ってな感じにエンコードされると思います.
ここに上のをかますと
ABCdefghiJKL
になっちゃうので場合によってはうれしくないかも.
検索ってことだけを考えると空白文字には
それほど存在意味がないかもしれませんが… どうなんだろ?
$str =~ s/^[\r\n][ \t]+/ /go;
$str =~ s/\s*(=\?ISO-2022-JP\?B\?[BASE64 な文字集合]+=\?=)\s*/$1/go;
$str =~ s/=\?ISO-2022-JP\?B\?(.*?)=\?=/decode_base64($1)/geio;
とか? (やるにしてももうちょっといい加減でいいかも)
--
やまだ あきら (akira@xxxxxxxxxxx or akira@xxxxxxxxxx)