Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Windows以外でRTF文書の文書フィルタの指定方法は?
吉野です。
> 検証して、来週にでも結果を報告いたします。
DocCat Ver3 + rtf文書フィルタに関する結果報告です。
両バージョンとも不具合もなく、正常にインデックスを
作成できています。
処理時間に関しては、msword.pl修正版の方が若干よい結果に
なっていますが、ほとんど変わらないようです。
つまり、お好みのバージョンをお使いください、ということです。
貴重なご意見をいただいた寺西さん、ありがとうございました。
-=-=-処理結果-=-=-
1)msword.pl修正版
文書数=6,592
所要時間 約3時間8分
File/Sec: 0.57
2)rtf.pl(msword.pl改造)版
文書数=6,600
所要時間 約3時間13分
File/Sec: 0.58
-=-=-対象文書-=-=-
文書種類=MS-Word95,MS-Word97,MS-Word98,MS-Word2000,PDF
-=-=-メッセージ(rtf.pl版)-=-=-
Added Documents: 6,600
Size (bytes): 958,019,601
Total Documents: 6,600
Added Keywords: 716,214
Total Keywords: 716,214
Wakati: module_kakasi -ieuc -oeuc -w
-=-=-追伸-=-=-
余談ですが今回の検証で、最新の DocCat にバグがあることが
わかりました。開発元(デ変研)からの回答では4月上旬に
対応版をリリースするとのことです。
******************************************
吉野 茂
******************************************