namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: MHonArc フッターを検索対象外に



Hirotaka Aoki <aoki@xxxxxxxxxxxxx> wrote:

>|2. [ml:00001] open (score: 13) 
>|      From: aoki <aoki@xxxxxxxxxxxxx> 
>|      Date: Fri, 05 Feb 1999 11:44:00 +0900 
>|	<<省略>>
>
>のように、From:, Date: のヘッダ付きで表示されています。
>
>他に必要な情報などありますでしょうか?

mknmz では

| sub mhonarc_filter ($$) {
|     my ($contents, $weighted_str) = @_;
| 
|     # MHonArc を使うときはこんな感じに処理すると便利
|     $$contents =~ s/<!--X-MsgBody-End-->[\s\S]*//;
|     $$contents =~ s/<!--X-TopPNI-->[\s\S]*<!--X-TopPNI-End-->//;
|     $$contents =~ s/<!--X-Subject-Header-Begin-->[\s\S]*<!--X-Subject-Header-End-->//;
|     $$contents =~ s/<!--X-Head-Body-Sep-Begin-->/\n/;  # ヘッダと本文を区切る
|     $$contents =~ s/^<LI>//gim;   # ヘッダの前に空白をあけたくないから
|     $$contents =~ s/<\/?EM>//gi;  # ヘッダの名前をインデックスにいれたくない
|     $$contents =~ s/^\s+//;
| }

のようなフィルタで MHonArc のファイルを処理しています。フッタを切
り落としている部分は

|     $$contents =~ s/<!--X-MsgBody-End-->[\s\S]*//;

の行です。 msgXXXXX.html ファイルを確認して <!--X-MsgBody-End--> 
の行があるか確認してみてください。

もし原因がわからなければ私の方へ一つその msgXXXXX.html ファイルを
送ってもらえれば、こちらで確認します。

# なんで [\s\S]* などという正規表現を使っているのだろうか? 当時は 
# s モディファイアを知らなかったのかな? > 自分

-- Satoru Takabayashi