Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

mknmz で HTML メールを index 化したい



taon@関東ヴァリエッタクラブ、です。

namazuシステムをメールスプールの検索に使う場合の質問です。
メールがプレーンテキストだとうまくいきますが、
その中にHTMLメールがあるとヘッダー部分しかindex化されません。
#もちろんHTMLメールの該当MIMEパートにはプレーンテキスト部分あり

HTMLメールまでindex化しようとして、mknmzのオプションで
--media-type='plain/text'とするとうまくできますが、
サマリーが汚いし、どういうわけか、データベースの
NMZ.field.subjectがメールヘッダーのSubjectになりません。
NMZ.field.subjectは下のphpで利用しているので
これは不都合です。

mknmzでHTMLメールのプレーンテキスト部分をうまくindex化
する方法があればお教えください。

namazuのバージョンは2.0.4、slackware 7でlinux 2.2.13です。
http://www.s-w.co.jp/ml/varietta-report/
で、やりたいことは、スプールにあるHTMLメールで送られたメールを
写真入りで表示できるようにphpでデコードして、また、そのメールの
中のテキスト部分をnamazuでデータベース化しようと考えています。
#現在上で動いているのはヘッダー部分しかindex化されていません
#なお、スプールにプレーンテキストをおいて、mknmzすれば当然
#それは全文index化されます

-- 
"ONO Takao" <taon@xxxxxxxxxxxx>, http://www.varietta.net/taon/