namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

mknm zでのインデックス作成に時間がかかりすぎて困っています。



 初めまして、広島の末広と申します。現在、Linux、NAMAZUと格闘して
います。

「日本語全文検索システムの構築と活用」を参考にして、メールの全文検索をする2週間
ほど前にシステムが動き出しました。
テストの段階で、メールが50通ぐらいであれば、1通当たり、数秒で処理され、100通
を超えると約1分かかるというの把握していたのですが、下記にありますように、急激
に処理時間が延びてしまっています。昨日は、バージョンを1.2.0.1から1.3.0.8にア
ップして動かしてみたのですが、結果は捗々しくありません。

1.パソコンのスペック
 型式 FLORA 350CV DV1(日立製)
 CPU AMD−K6−2 with 3DNOW 300MHz
 HDD 3.2GB(内Windows98で2GB、Linuxで1GB)

2.ソフトのバージョン
 Linux 2.0.3.6
 NAMAZU 1.3.0.8
 Perl 5.00501
 gcc 2.4.2.3
 nkf 1.62

3.実行時の様子(TOPコマンドで調査)
 CPU states: 0.3% user、4.1% system、0.0% nice、93.6% i
del
 MEM:14664k av、14428k used、236k free、1044k shrd、36k buff
 Swap:124988k av、3328k used、910324k free、632k cached
 size 23086、RSS 10M、share R、CPU 3.0、MEM 72.3、time 11
:56
 なお、実行はcrontab内で、下記のように指定しています。
00 02 * * *  /usr/local/bin/mknmz -O /usr/local/apache/var/index/ /usr/local
/apache/share/htdocs

4.症状
・下記の動作記録のように、インデックス作成の対象となるメールが増えると、急激に
インデックス作成時間が増える。
・上記の症状は、テスト時からその兆候があった。100通ぐらいで、1通あたり1分ほど
かかっていた。
・インデックスの作成後は、他のマシンから検索はできる。内容の表示にも問題は無い
。

5.ご教示願いたいこと
・参考書を元に必要なソフトをCD-ROMからインストールし、また、本の指示どお
りにダウンロードをしてパッチを当てたつもりです。再度確認すべき点や、最新のフ
ァイルの情報等があればご教示をお願いしたします。
・上記以外に、設定ファイルの本の通りにしましたが、何か問題があればご指摘くださ
い。
・その他、原因追及の手助けとなるような、ヒントなり、アドバイスなど、気づかれた
ことは何でも結構ですので、ご指摘ください。(最悪の場合、Linuxの再インス
トールからやり直しても言いと考えています。)

6.動作記録(添付ファイルで、Excelの表をつけてあります)
全文検索システム動作記録								

年月日	曜日  メール数 時間	CPU	キーワード数 メール容量	
1999/6/23	水曜日  19通	   2分	60秒	9,400	     ?	
1999/6/24	木曜日  30通	    4分	128秒	13,000	     ?	午前3時に起動するよう
に設定
1999/6/25	金曜日  48通	    8分	371秒	24,000	     ?	
1999/5/25	金曜日  55通	  11分	466秒	26,600	   1.20MB	
1999/6/26	土曜日  63通	  15分	639秒	29,800	   1.40MB	
1999/6/27	日曜日  66通	  17分	764秒	30,500	   1.50MB	
1999/6/28	月曜日  74通	  19分	962秒	32,000	   1.60MB	
1999/6/29	火曜日  93通	  30分	1,639秒 37,000   1.67MB	
1999/6/30	水曜日 119通	  80分	4,602秒 42,000   2.05MB	
1999/7/1	木曜日 132通	 134分	7,847秒 44,900   2.30MB	
1999/7/2	金曜日 154通	 246分	14,554秒 50,386  2.74MB	
1999/7/3	土曜日 170通	 304分	18,054秒 52,725  3.43MB	
1999/7/4	日曜日 176通	 340分	20,179秒 53,678  3.50MB	
1999/7/5	月曜日 187通	 358分	21,311秒 54,451  3.57MB 午前3時に起動、午前
9時に終了
1999/7/6	火曜日 206通	 463分	27,319秒 57,927  3.93MB 起動時刻を午前2時に
変更
1999/7/7	水曜日 230通	 532分	31,676秒 61,557  4.27MB 1.3.0.8にup

以上、よろしくご教示のほどお願い致します。

Attachment: 動作記録.xls
Description: application/msexcel