Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: mknmz-F について



寺西です。

Yoshio Funaki wrote:
> 
> で、問題なのが4)なのですが、想定しているのは、日時で改変や削除が
> あった文書をindexに反映することなんですが、改変のみであれば、
> 同様に--no-deleteで行けそうですが
> 削除の場合、私の考えた
> ”index対象ファイルを書き並べたファイルにファイル名を書いておいて、
> 実体を作らない”
> と言う方法で、うまくindexに削除されたという情報が反映されるものでしょうか?

index から対象文章を削除するのは難しいです。

# そういう機能は用意されていないですね。たぶん。

index から対象文章を外すには、対象とする全ファイルリストを作成して、
mknmz -F 対象とする全ファイルリスト を実行する必要があります。
この際、対象とする全ファイルリストの実体(元ファイル)が必要です。
(index から対象文章を削除する方の実体はあってもなくても良い。)

あるいは、-F で指定するリストは削除対象のものを含んでいても
よいが、index から対象文章を削除する方の実体を削除するかです。
(index に残す対象とする全ファイルの実体は必要)

# ということで、現実的ではないでしょう。それができるなら、分割
# して index を作ったりしないから。

index から対象文章を削除するよりは、index を 1 から作り直す方が
簡単です。
しかし、時間がかかるので index の再構築を文書を削除した度に行うわけ
にはいかないでしょう。そこで、定期的に負荷の低い時間帯にでも
index の再構築をして、普段は検索結果で返された文書管理IDが削除文書
なのか否かで判断すれはよいのではないでしょうか?
(DB 側で、文書管理ID から削除された文書か否かを判断するというわけ
です。)
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E