namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: uuencode_filter() in mknmz.pl



Hiroshi Kato <tumibito@xxxxxxxxxxxxxxxxxxx> wrote:

>(私にとって)メチャメチャ不幸なことに,mknmz で -u オプションをつけると
>
>Message-ID: <yv7hg5u25bj.fsf@xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx> 
>Message-Id: <9805080230.AA00576@xxxxxxxxxxxxxxxxxxxxxxxxxxxx>
>
>という文字列 (61 文字ある!)は読み飛ばされるのですね.

なるほど。頭の 'M' と61文字というのが uuencode の式にあてはまって
しまうのですね。


>uuencode の仕様から考えると,この読み飛ばす処理をしている 
>uuencode_filter() の処理は概ね妥当なところだとは思うのですが,困ったこ
>とに,当方のサイトは,巨大な uuencode 付記事や,この手の Message-Id: な文
>字列付記事が結構あるのです.
>
>どうすると幸せになれるでしょう?もし,アドバイスがあれば,お願いします.

昔は /^begin [0-7]{3,4} \S+$/ という行が来てから uuencode の処理を
始めたのですが、

| News などでファイルを分割して投稿されているものの場合 begin がない
| ことがあるのでそれを考慮します by S.Takabayashi [v1.0.5]
| 偶然マッチすることはほとんどないとは思いますが…

という理由であるときから begin がなくても式にあてはまる場合は 
uuencode としてみなすようにしてしまいました。


>(1) uuencode_filter 中で ^Message-Id: にマッチしたら,たとえ 61 文字でも
>    読み飛ばさないようにする.
>(2) 1行だけ uuencode 付記事はまずないから,前後の行をみて判断する.

やるなら (2) かな。明日にでも挑戦してみます。

--
高林 哲 Satoru Takabayashi