Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 検索されない文書がある?



しみずと申します。

症状を拝見すると、私の経験したものときわめてよく似ているようですね。


私は追加したばかりのファイルを検索することがよくあります。

それでヒットしない時は大抵キーワードの間違いや操作ミスなどですが、時たま
どうやってもヒットしないばかりか、よく調べるとぜんぜん関係のないものが
ヒットするようになってしまうことがあり、ずっと悩みの種でした。

Windows環境やハードウェアの不具合、もしくは文書フィルタとして使用する
もの(MS officeとか)が原因である可能性は否定できませんが、Namazu 自体
のバージョンアップや異なるOSでも似たような症状が発生していることを
考えると、Namazu自体の問題なのかもしれません。


> # 検索エンジンは,探してる対象が分からないから使うわけで,こういった症状は見
> # つけにくいケースかもしれませんね.

確かにインデックス化されているデータそのものをよく知らないまま利用して
いると、ヒットしたファイルを見ても「そんなものか」と思うだけで、よほど
おかしな結果でも返さない限りは気がつきにくいですよね。

#Indexファイルの構造をきちんと理解していないので単なる思い付きですが、
#既存の index に追加を繰り返していくうちにファイルへのリンク情報が
#失われてしまうと、このような症状になるのかもしれません。

> gcnmzは使っていませんし,index再作成時に削除されるファイルもありません.(追
> 加のみ)追加の際は,--updateは使わず,毎回同じオプションを使って,
> --no-deleteを使うことで,追加処理にしています.

時々実行する gcnmz が原因なのか、とも思いましたが、そうでもなさそうです。

参考までに、mknmz の実行は、毎回
|c:\namazu\bin\mknmz -EVU --target-list=E:\nmzindex\targets.txt 
|--config=C:\namazu\etc\namazu\mknmzrc --checkpoint -O E:\nmzindex\main
というコマンドで行っています。

対象ファイルと index ファイルとの整合性は mknmz するたびにチェックされる
ようですが、それとは別に、index ファイルの整合性をチェックするツールがあ
ると何かわかるのかもしれません。


Tokuro Shimizu
tshimizu@xxxxxxxxxxx