namazu-dev(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: divide filtering process.



たかくまさお@図情大です。

<199907130926.SAA05527@xxxxxxxxxxxxxx>の記事において
knok@xxxxxxxxxxxxxさんは書きました。
> >> 総数:24161通
> >> message/rfc822           24087通
> >> message/news                66通
> >> application/octet-stream     5通
> >> text/plain;                  2通
> >> text/html                    1通
> 
>   application/octet-streamその他に認識されたものがちょっと気になるので
> すが、この辺りはどのようなデータが誤認されたのか、差し支えなければ教え
> て頂けませんでしょうか?

application/octet-streamと認識したメールは全て
Excelのタブ区切りテキストが張り付けてあるメールでした。

text/plain; x-type=rfcと認識したメール2通の内、
一通はRFC全文が転載されているメール。
もう一通は文中に、
Category: international
という一行がある文章でした。
## と書くと、このメールもRFCと認識されてしまうのだろうか? :-)

text/htmlと認識された文章は文中に"<TITLE> </TITLE>"という
文字列が現れていました。

# なお、text/newsは全てNetNewsに投稿された記事です。

参考になれば幸いです。
--
高久 雅生  // ULIS : University of Library and Information Science
    図書館情報大学大学院 図書館情報学研究科 修士 2 年次  石塚研究室
    masao@xxxxxxxxxx , http://www.ulis.ac.jp/~masao/