namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

mailnews_citation_filter



古川です。

mknmz.pl に mailnews_citation_filter という便利な処理がありますが、こ
こでカットされたデータが、全部そのまま $weighted_str に入ってしまうの
で、例えば、

-------------------------- Sample From Here --------------------------
  > 明けましておめでとうございます。旧年中はたいへんお世話に
  > なりました。本年もよろしくお願い致します。

おめでとうございます。
こちらこそよろしく。
-------------------------- Sample To Here ----------------------------

なんてメールがあると、NMZ.i には、

「明けましておめでとうございます。旧年中はたいへんお世話になりました。
本年もよろしくお願い致します。」

なんて単語が登録されてしまいます。(オプションとしては '-u -h -H' を指
定して使っています)


ここで、どんな仕様がいいのかは、いろんな考えがあると思いますが、私だっ
たら、「引用部分は要約には載らないけれど、WAKACHI して検索には引っ掛け
る」というのが好きです。

いずれにしても、現在、要約用のデータと検索用のデータは $contents が兼
ねていますが、これは分離した方がスッキリするように思います。

-- 

                                        ヤマハ(株)ピアノプレーヤ設計課
                                                              古川 令
                                             furukawa@xxxxxxxxxxxxxxxx