namazu-ml(ring)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: MHonArc フッターを検索対象外に
Hirotaka Aoki <aoki@xxxxxxxxxxxxx> wrote:
>|2. [ml:00001] open (score: 13)
>| From: aoki <aoki@xxxxxxxxxxxxx>
>| Date: Fri, 05 Feb 1999 11:44:00 +0900
>| <<省略>>
>
>のように、From:, Date: のヘッダ付きで表示されています。
>
>他に必要な情報などありますでしょうか?
mknmz では
| sub mhonarc_filter ($$) {
| my ($contents, $weighted_str) = @_;
|
| # MHonArc を使うときはこんな感じに処理すると便利
| $$contents =~ s/<!--X-MsgBody-End-->[\s\S]*//;
| $$contents =~ s/<!--X-TopPNI-->[\s\S]*<!--X-TopPNI-End-->//;
| $$contents =~ s/<!--X-Subject-Header-Begin-->[\s\S]*<!--X-Subject-Header-End-->//;
| $$contents =~ s/<!--X-Head-Body-Sep-Begin-->/\n/; # ヘッダと本文を区切る
| $$contents =~ s/^<LI>//gim; # ヘッダの前に空白をあけたくないから
| $$contents =~ s/<\/?EM>//gi; # ヘッダの名前をインデックスにいれたくない
| $$contents =~ s/^\s+//;
| }
のようなフィルタで MHonArc のファイルを処理しています。フッタを切
り落としている部分は
| $$contents =~ s/<!--X-MsgBody-End-->[\s\S]*//;
の行です。 msgXXXXX.html ファイルを確認して <!--X-MsgBody-End-->
の行があるか確認してみてください。
もし原因がわからなければ私の方へ一つその msgXXXXX.html ファイルを
送ってもらえれば、こちらで確認します。
# なんで [\s\S]* などという正規表現を使っているのだろうか? 当時は
# s モディファイアを知らなかったのかな? > 自分
-- Satoru Takabayashi