Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Windows以外でRTF文書の文書フィルタの指定方法は?
- From: yoshino@xxxxxxxxxxxxxxxxxxx
- Date: Tue, 18 Mar 2003 18:24:34 +0900
- X-ml-name: namazu-users-ja
- X-mail-count: 03105
吉野と申します。
ずいぶん前のお話になりますが、RTFに関する文書フィルタのお話が
あったと思います。
結論として Windows 以外では RTF文書フィルタが存在しないという
ところで終わっていましたし、実際に
http://www.namazu.org/doc/manual.html#doc-filter
では現在も RTF文書フィルタは Windows 専用になっています。
ただ、DocCat の最新バージョン(Ver3)は RTF を標準サポートして
います。こちらの動作環境は Solaris2.6 ですが、mknmz で
Unsupported media type (application/rtf) skipped.
が表示された文書を、DocCat でテキスト抽出したところ、正常に
テキスト展開ができました。
もちろん全てのパターンを検証できたわけではないのですが、
今のところ問題がないようです。
今使用しているのは namazu-2.0.10 ですが、Windows 以外でRTF文書の
文書フィルタを指定できないため、困っているというよりもったいない
気がします。
msword.pl と同じような位置付けで、olertf.pl の代替品に DocCat を
RTF文書の文書フィルタに指定することはできないでしょうか。
ご存知の方がいらっしゃいましたらご教授ください。
よろしくお願いいたします。
# mknmz -C
System: solaris
Namazu: 2.0.10
Perl: 5.006
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
ChaSen: no
Wakati: module_kakasi -ieuc -oeuc -w
Lang_Msg: japanese
Lang: japanese
Coding System: euc
CONFDIR: /usr/local/etc/namazu
LIBDIR: /usr/local/share/namazu/pl
FILTERDIR: /usr/local/share/namazu/filter
TEMPLATEDIR: /usr/local/share/namazu/template
Supported media types:
application/excel
application/ichitaro6
application/msword
application/pdf
application/powerpoint
application/x-compress
application/x-gzip
application/x-js-taro
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; x-type=rfc
text/x-hdml
text/x-roff
******************************************
吉野 茂
******************************************