Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: ファイルが巨大...および excel.pl など
廣瀬と申します。
At Thu, 21 Jun 2001 13:20:24 +0900,
Fumitaka Kitagawa wrote:
> 先ずは、サンプルとしてtestsフォルダに入っているword6.docとword95.docが
> 未対応の形式:word7
> となって、インデックス化できないことです。wvWareでは対応しているようで
> すが、何が問題なのでしょうか。
word7形式の日本語word書類を wvWareではうまく処理することが
出来ません。そのため filter/msword.plでwordのバージョンを
チェックして、word7形式の場合はインデックスの対象にしていません。
付属マニュアル msword.pl の項を参照すると
以下のようになっています。
namazu-2.0.5/doc/ja/manual.html#doc-filter
msword.pl
Microsoft Word文書を扱う (日本語版は Word 97, 98, 2000)
必需品: wvWare, lv
代替品: doccat
> 次に、インデックス化のときに
> ファイルが巨大なので無視します。
> となり、処理されないことです。どうも、PDFファイルで起きているようです。
> ファイルサイズは1MB台のものです。
> 関係ないと思うけど、試しにmknmzrcのテキストサイズの最大を10MBに設定し
> ましたが駄目でした。他の形式で同じエラーが起きていたのは、起きなくなっ
> たのですが...。
$FILE_SIZE_MAX, $TEXT_SIZE_MAX の値を、適宜増やしてみてください。
うちでは、 $FILE_SIZE_MAX = 10000000;
となっています。
> 最後はexcel.pl。
> 最新の昨年12月の版にするとexcelファイルが未対応の形式になってしまいます。
namazu-2.0.5.tar.gz をmakeして、インストールせずに
make checkすると、どうなりますでしょうか。
> wv-0.6.5.tar.gz
この版ならword7形式がいけるのかな、とおもい、
インストールして試しましたが、やっぱり駄目でした。