Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: インデックス作成時に、時間がかかりすぎるファイルを飛ばして次のファイルへ



小舞といいます。
なまずにはお世話になっています。

直接の回答になるかどうか、わからないのですが、
特定のファイル(1個で、しかも拡張子がdocとよく使うファイルですよね)のみを除外
する
のは、なかなか、除外ファイルの指定の方法では大変だとは思うのですが、

http://www.namazu.org/doc/manual.html#mknmz-option
の
mknmzコマンド行引数
    mknmz 2.0.6, Namazu のインデックス作成プログラム 
    
    使い方: mknmz [オプション] <対象>...
    
    対象ファイル:
      -a, --all                すべてのファイルを対象とする
      -t, --media-type=MTYPE   対象ファイルの文書形式を指定する
      -F, --target-list=FILE   インデックス対象のファイルのリストを読み込む
          --allow=PATTERN      対象とするファイル名の正規表現を指定する
          --deny=PATTERN       拒絶するファイル名の正規表現を指定する
          --exclude=PATTERN    除外するパス名の正規表現を指定する
の中の--deny=PATTERNとかですが。
たった一つのファイル名のために、正規表現を考えるのも
なんだとは思いますが。

=以下はご参考=
あくまで、自分(=小舞)ならこうするという意味で受け取って下さい。
      -F, --target-list=FILE   インデックス対象のファイルのリストを読み込む
を使うことを前提として、
(1)ファイルリストを何らかの方法で作成
(2)ファイルリストから、上記の除外したいワードのフルパス名を除外するような
   AWKスクリプトを作成し
(3)上述の--target-list=FILEというオプションを使う。

というのは如何でしょうか?
(2)のフルパス名で除外するというのが味噌で、これなら、確実に
所望の1つのファイルだけを除外できますが。

以上、ご参考まで。

2002/11/14 17:20:25 Takashige Omura 様 wrote --
>はじめて投稿させて頂きます、大村と申します。
>これからよろしくお願いします。
>
>mknmzのインデックス作成時にどうにも時間のかかるファイルがあって困っていま
>す。
>数日間そのままにしておきましたが、
>一向に終わる気配がありませんでした(処理中のままで、エラーで止まっているわけ
>ではないようです)
>一応特定のファイル(Wordファイル)で起こっているようなのですが、
>普通に開く分には、そのファイル自体になんら問題はなさそうでした。
>問題は、この時にNamazuがマシンのCPUパワーと、
>メモリをごっそり持っていってしまっているので、
>とりあえず、1時間以上たっても終わらない場合は、
>飛ばして次のファイルへ行くと行った設定が出来ないものでしょうか?
>問題が起きている環境を下記に表記しておきます。
>どなたかヒント等ありましたら、ご教授お願いします。
>
>CPU : PentiumII 450MHz
>Memory : 512MB
>HDD : 40GB
>Windows2000Server + SP3
>IIS5
>Namazu 2.0.12
>kakasi 2.3.4
>ActivePerl 5.6.1.633
>MSOffice2000