Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: robots.txtをインデックスから除外するには?
From: Takuya Tsumura <tsumura@xxxxxxxxxxxxxxxxxx> さん曰く
Subject: [namazu-users-ja] Re: robots.txtをインデックスから除外するには?
Message-ID: <20020917063436.16571@xxxxxxxxxxxxxxxxxxxxxxxxxxx>
Date: Tue, 17 Sep 2002 15:34:36 +0900
> >× $DENY_FILE = ".*\\robots.txt|.*\\.pdf";
> >○ $DENY_FILE = "robots\\.txt|.*\\.pdf";
>
> 上記○をmknmzrcに設定し,インデックスを削除し新たに作り直しました.
> インデックス作成時のログを見ると,以下のようになっており,
> robots.txtがインデックスに含まれてしまっています.
仕様だと思いますが、
> /usr/local/bin/mknmz --robots --target-list=<次行と継続してます>
> /home/www/cgi-data/jwri-info/index_list.txt --deny='robots\\.txt|.*\\.pdf'
--deny をつけると mknmzrc に書いた $DENY_FILE は無視されます。そ
して、オプションの --target-list と --deny は両立しなようです。
津村さんのスクリプトでは上記の組合わせになっているので mknmzrc
の $DENY_FILE が無視されているのでしょう。だから、
/usr/local/bin/mknmz --robots \
--target-list=/home/www/cgi-data/jwri-info/index_list.txt
だけにして --deny オプションを消せばうまくいくと思います。
> もしかすると,mknmzを実行する際に/usr/local/etc/namazu/mknmzrcを
> 読みにいけてないだけかもしれません...
ちゃんと読みに行っているかどうかは mknmz --show-config でわかる
ので確かめると良いです。
--
白井秀行 (mailto:shirai@xxxxxxxxxxxxxxxxxxx)