namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Plan for Namazu next version



Fri, 30 Jan 1998 02:51:24 +0900 頃の
   Mail-Count: 00069
      Subject: [namazu:00069] Re: Plan for Namazu next version   
についてのお話にて Satoru Takabayashi さん曰く… 
(S == Satoru Takabayashi <ccsatoru@xxxxxxxxxxxxxxxxxx> さん)

>> これだと長い文字列が MIME エンコードされた場合など
>> エンコード文字列が適当に分割されているケースで
>> 問題になりませんかね?

In article 00069, <199801291754.CAA06530@xxxxxxxxxxxxxxxxxx>
S> うーむ。ちょっと問題ありますね。修正するとすれば
S> 
S>      my ($str) = @_;
S>      $str =~ s/^[ \t]+//mg;
S>      $str =~ s/[\r\n]+//g;
S>      $str =~ s/=\?ISO-2022-JP\?B\?(.*?)=\?=/decode_base64($1)/gei;
S> 
S> かな。

$str になにが渡ってくるのかにもよりますが

  ABCdef  ghiJKL

みたいのは

  =?ISO-2022-JP?B?ABC?= def  ghi =?ISO-2022-JP?B?JKL?=

ってな感じにエンコードされると思います. 
ここに上のをかますと

  ABCdefghiJKL

になっちゃうので場合によってはうれしくないかも. 
検索ってことだけを考えると空白文字には
それほど存在意味がないかもしれませんが… どうなんだろ?

  $str =~ s/^[\r\n][ \t]+/ /go;
  $str =~ s/\s*(=\?ISO-2022-JP\?B\?[BASE64 な文字集合]+=\?=)\s*/$1/go;
  $str =~ s/=\?ISO-2022-JP\?B\?(.*?)=\?=/decode_base64($1)/geio;

とか? (やるにしてももうちょっといい加減でいいかも)

--

 やまだ あきら (akira@xxxxxxxxxxx or akira@xxxxxxxxxx)