Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: インデックス生成時間と kakasi 辞書ファイルについて
廣瀬と申します。
At Fri, 24 May 2002 12:08:57 +0900,
後藤 史織(AC−Tech) wrote:
> 私が調べたところでは、インデックスの生成の際、デフォルトで差分だけ
> 更新され、gcbmzというツールを利用することで、インデックスを掃除する
> ことが出来るとのことなのですが、
> その際、差分だけ更新するということは、インデックス生成の時間も
> 2回目以降は大幅に減少するのでしょうか?
はい、大幅に減少します。
> 例えば、更新されているファイルが1つしかなければ、
> 1つのドキュメントのインデックスを生成する時間と同じ。と
> 考えて宜しいのでしょうか?
いいえ。
mknmzでインデックスを作成、その後数回インデックスを更新した場合
すでにあるインデックスと実際のファイルの調査をしますから、その分の
オーバーへッドは存在します。
また、
存在しないファイルの情報も、そのままインデックスに残っています。
gcnmzはその不要なインデックスの情報を削除してくれます。
しかし、このインデックスの掃除はかなりの時間を必要とします。
> 他の辞書ファイルを参照させたり、kakasiの辞書ファイルに、単語を登録したい
> と考えておりますが、そのそのようなことは可能でしょうか?
以下のURLをご覧下さい。
http://www.namazu.org/ml/kakasi-dev/msg00034.html
----
HIROSE, Yoshihide