Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: メール、ニュースの添付ファイルの内容もインデックス化可能ですか。
渡辺です。
野首様、ご回答ありがとうございました。
NOKUBI Takatsuguさんの記事
<200104280639.PAA03635@xxxxxxxxxxxxxxxxxx>から
----------------------------------------------------------------
> テキスト部分と添付データをテキストに変換したものを単純に繋げて、それ
>をインデックス化する、というよう処理をするように filter/mailnews.pl を
>修正することは(がんばれば)可能かもしれません。
ということは、添付ファイルは通常MIMEエンコードされていますから、
・添付ファイルをデコード
・テキストの抽出
・メール(記事)本文と連結
・インデックス化
という手順になるわけですね。
それから、今考えてて分かったのですが、実装する上で更に問題があることに
気が付きました。
というのは、当然、検索できたものに関しては現物(エクセル・ワードファイ
ル)を参照したいのですが、それらが検索結果から容易にアクセスできるよう
にする方法も考えてやらないといけないわけですね。
かなりハードルが高いことに気づき、ちょっと意気消沈しそうですが、なにか
いい打開策がないか、いろいろと考えてみようと思います。ありがとうござい
ました。
--
渡辺 英史
mailto:hwatanab@xxxxxxxxxxxxxxxxx