Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: PHP、CGIファイルなどを検索対象から外すには



こんにちは、高石です。

サンプルにある $ALLOW_FILE の設定は、8行まとめて1つの文です。
それを部分的にコメント解除してしまったのが失敗のもとでしょう。

From: kenbooo55@xxxxxxxxxxxx
Subject: [namazu-users-ja] PHP、CGIファイルなどを検索対象から外すには

> mknmzrc の設定を
> 
> ------------------------------------------------------------------------
> 
>  $ALLOW_FILE =  ".*¥¥.(?:$HTML_SUFFIX)" .          #|.*¥¥.txt" . # HTML, plain text

この最後(#の前)にピリオドがあるため、$ALLOW_FILEの設定は継続。

> #               "|.*¥¥.gz|.*¥¥.Z|.*¥¥.bz2" .       # Compressed files
> #               "|.*¥¥.pdf|.*¥¥.ps" .              # PDF, PostScript
> #               "|.*¥¥.tex|.*¥¥.dvi" .             # TeX, DVI
> #               "|.*¥¥.rpm|.*¥¥.deb" .             # RPM, DEB
> #               "|.*¥¥.doc|.*¥¥.xls|.*¥¥.ppt" .    # Word, Excel, PowerPoint
> #               "|.*¥¥.j[sabf]w|.*¥¥.jtd" .        # Ichitaro 4, 5, 6, 7, 8
> #               "|¥¥d+|[-¥¥w]+¥¥.[1-9n]";          # Mail/News, man

本来はこの上の行の ; で終わるはずが、コメントアウトされてい
るため、さらに継続。
> 
>  $DENY_FILE = ".*¥¥.txt|.*¥¥.cgi|.*¥¥.php|.*¥¥.(gif|png|jpg|jpeg)| ¥#改行
> .*¥¥.tar¥¥.gz|core|.*¥¥.bak|.*‾|¥¥..*|¥x23.*";

この部分も、$ALLOW_FILE = から続いている一文に含まれてしまう。

> 色々と検索をしていると、PHPやCGIファイル以外にも
> 検索対象としたくないファイルが色々とあることが発覚し、
> (*.cfgなんてものも出てきました。)
> 今はとにかく「*.html」以外のファイルは検索対象としないよう
> にできればと考えています。

htmlだけ検索すればよいのなら、$DENY_FILEは使わずに、

$ALLOW_FILES = ".*¥¥.(?:$HTML_SUFFIX)";

だけでいいと思います。
/--------------------------------------------------------/
  高石 勇人 < rio-t@xxxxxxxxx >
  PGP Key(RSA): http://rio-t.presen.to/pgp/mykey.asc
         (DSS): http://rio-t.presen.to/pgp/mykey-dss.asc
/--------------------------------------------------------/