Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: ファイルが巨大...および excel.pl など



廣瀬と申します。

At Thu, 21 Jun 2001 13:20:24 +0900,
Fumitaka Kitagawa wrote:

> 先ずは、サンプルとしてtestsフォルダに入っているword6.docとword95.docが
>   未対応の形式:word7
> となって、インデックス化できないことです。wvWareでは対応しているようで
> すが、何が問題なのでしょうか。

word7形式の日本語word書類を wvWareではうまく処理することが
出来ません。そのため filter/msword.plでwordのバージョンを
チェックして、word7形式の場合はインデックスの対象にしていません。

付属マニュアル msword.pl の項を参照すると
以下のようになっています。

 namazu-2.0.5/doc/ja/manual.html#doc-filter

 msword.pl 
    Microsoft Word文書を扱う (日本語版は Word 97, 98, 2000) 
    必需品: wvWare, lv 
    代替品: doccat 


> 次に、インデックス化のときに
>   ファイルが巨大なので無視します。
> となり、処理されないことです。どうも、PDFファイルで起きているようです。
> ファイルサイズは1MB台のものです。
> 関係ないと思うけど、試しにmknmzrcのテキストサイズの最大を10MBに設定し
> ましたが駄目でした。他の形式で同じエラーが起きていたのは、起きなくなっ
> たのですが...。

$FILE_SIZE_MAX,  $TEXT_SIZE_MAX  の値を、適宜増やしてみてください。

うちでは、 $FILE_SIZE_MAX   = 10000000;
となっています。

> 最後はexcel.pl。
> 最新の昨年12月の版にするとexcelファイルが未対応の形式になってしまいます。

namazu-2.0.5.tar.gz をmakeして、インストールせずに
make checkすると、どうなりますでしょうか。

> wv-0.6.5.tar.gz

この版ならword7形式がいけるのかな、とおもい、
インストールして試しましたが、やっぱり駄目でした。