namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: mknmz's Order



始めまして、高木@時事通信社と申します。

現在、社内的に使う記事全文検索サーバをNamazuで構築しようとしています。
扱うデータは年間10万本程度、一日300〜400本で一記事のサイズは1〜2KB程度で
す。
マシンの構成はP2-350MHz,メモリ256MBです。
15分ごとに当日更新分のインデックスを作成し、日替わり時に過去データに追加
更新したインデックスを作成しようとしています。記事ファイルにはユニークな
ファイル名が付いており、ファイルは追加のみです。

ここで疑問なのですが、追加更新に割ける時間はせいぜい1時間程度なのです
が、記事がたまってきた場合、インデックス作成が破綻しないかということで
す。
つまりmknmzが10数万件のインデックスに毎日400本程度の追加更新を行う場合か
かる時間は
1.400本のデータに対するインデックス作成時間プラスアルファですむ
2.10数万件のインデックスを作りなおす事に近い
のどちらなのでしょう。

また、追加更新されたインデックスと始めから10数万件のデータに対し作成され
たインデックスとで、検索時のパフォーマンスに影響は出るのでしょうか。

(株)時事通信社
システム局 開発部
高木淳一郎
j@xxxxxxxxxx
jun@xxxxxxxxxx