Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: mknmz のパフォーマンスについて



西森です。

返信ありがとうございます。

会社と自宅でメールを受信しているのですが、
誤って自宅で藤原様のメールをサーバから削除してしまい、
マナー違反のリプライになっていると思います。
申し訳ありません。

On Sat, 09 Jun 2001 11:43:58 +0900,
In "[namazu-users-ja] Re: mknmz のパフォーマンスについて",
藤原  誠 / Makoto Fujiwara <makoto@xxxxx> 様 wrote:

> 西森さん> これらのファイルのインデックス化が丸一日かけても終わら
> 西森さん> ないのです。
> 
> とおっしゃられていますが、一日経った時に、画面にはどのような表示
> が出ているのでしょうか。差障りがなければ、その数行を見せていただ
> ければ何か分るかも知れません。

1848/2916 - /data/plane/900/jinkou-tuki-hyo-2000.07.files/sheet002.htm
 [text/html]
1849/2916 - /data/plane/900/jinkou-tuki-hyo-2000.07.files/sheet003.htm
 [text/html]
1850/2916 - /data/plane/900/jinkou-tuki-hyo-2000.07.files/tabstrip.htm
 [text/html]
1851/2916 - /data/plane/900/jinkou-tuki-hyo-2000.07.htm [text/html]
(途中改行を入れています)

のようにエラーが出るのではなく、処理が重くなっているだけのようです。

> pdf とか Excel は外部のプログラムを呼出しているので、それらの設置
> に何か不都合があるという可能性もあります。種類を一つだけにして
> 速さを見た方がいいかも知れません。
> ~/.mknmzrc に
> $ALLOW_FILE  = '.*\.html?|.*\.txt|.*_default|.*\.pdf|.*\.doc';
> というような字があるかと思いますが、件えば、
> $ALLOW_FILE  = '.*\.pdf';
> としておけば pdf だけ選んで試せると思います。

HTML、PDF、EXCELのそれぞれについて試してみました。

・HTML
[基本]
日付:                Mon Jun 11 10:09:44 2001
追加された文書の数:  803
サイズ (bytes):      81,646,889
合計の文書数:        803
追加キーワード数:    34,322
合計キーワード数:    34,322
わかち書き:          module_kakasi -isjis -osjis -w
経過時間 (秒):       524
ファイル/秒:         1.53
システム:            linux
Perl:                5.00503
Namazu:              2.0.4

・PDF
[基本]
日付:                Mon Jun 11 09:49:32 2001
追加された文書の数:  114
サイズ (bytes):      9,583,595
合計の文書数:        114
追加キーワード数:    27,848
合計キーワード数:    27,848
わかち書き:          module_kakasi -isjis -osjis -w
経過時間 (秒):       98
ファイル/秒:         1.16
システム:            linux
Perl:                5.00503
Namazu:              2.0.4

・EXCEL

754/2008 - /data/plane/61/2-6-14-189-toukei-chihoujichi.xls [application/excel]
755/2008 - /data/plane/61/2-6-14-190-a-b-toukei-chihoujichi.xls 
[application/excel]
756/2008 - /data/plane/61/2-6-14-191-a-toukei-chihoujichi.xls 
ファイルが巨大なので無視します
756/2007 - /data/plane/61/2-6-14-191-b-toukei-chihoujichi.xls 
[application/excel]
757/2007 - /data/plane/61/2-6-14-191-c-toukei-chihoujichi.xls 
ファイルが巨大なので無視します
(途中改行を入れています)

この状態で数時間待ちましたが、先に進まない状態になりました。

Excelファイル、もしくはxlHtml、lvに問題があるということになるかと
思います。
xlHtmlは0.2.6、lvは4493を利用しています。

とりあえず、問題のありかがわかっただけでも随分進歩できました。
色々調べてみようと思います。
本当にありがとうございました。

---------------------------------------
西森 千代子
E-Mail:chiyoko@xxxxxxxxxxxxxxx