namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: NMZ.r



Gorochan ^o^ <kunito@xxxxxxxxxxxxxxxxxxx> wrote:

>このファイルを mknmz で使うときには、全て配列に読み込んでいると思うの
>ですが、DB file と tie を使ってみてはどうでしょうか?

うーん、なるほど。登録されたファイルの数が多くなると全体を配列に読
み込むのは無理が出てくるかもしれないので、考えてみる必要はありそう
ですね。


>たしか今のところ namazu は更新ファイルに関しては再検索してくれなかった
>ような気がしたので、日付も記録すると更新ファイルも検索してくれるだろう
>と思った次第です。

えっと、更新されたファイルの処理およびインデックスからのファイルの
削除の機能も考えてはいるのですが、もうしばらく先になりそうです。順
序としては特定フィールド指定の検索 (From: とか) を実装してその次と
いうことになります。


>しかしながらこの場合、更新、あるいはファイルの削除によって減るはずのキー
>ワードをどのように処理するか、という問題が生じると思います。

これは真面目にインデックスからデータを削除すると大変なのでそのまま
残しておいて、別のファイルに欠番情報を記録して検索の際にそれを参照
するという形がお手軽だと思います。

登録されたファイルは数値で ID を持っていますから、その値に対して有
効/無効という情報を記録しておくわけです。で、無効 (欠番) にされた
ID については検索結果には現れない、と。この方法だと更新のあったファ
イルは一旦削除 (欠番にする) して再登録するという形になりますね。

これを繰り返していると欠番が増えてインデックスが穴だらけになって効
率が悪くなってしまうので、欠番を埋めるツールも考える必要があるかも
しれません。

--
高林 哲 Satoru Takabayashi