Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: インデクス化の除外方法
おおもと投稿者の磯部です。
たくさんのレスありがとうございます。
"Rei FURUKAWA <furukawa@xxxxxxxxxxxx>" wrote:
> From: teranisi@xxxxxxxxx
> Subject: [namazu-users-ja] Re: インデクス化の除外方法
> Date: Fri, 05 Jan 2001 17:29:44 +0900
> teranisi> その専用のコンフィグレータWebが何者か知りませんが、
>
> 私もそれが何者か知りませんが、なんか、有用そうな感じがします。
>
> # 公開してくれないかなあ… > 業者のかた
いや、全然、使えないっすよ。
ディレクトリ単純に指定するだけですから。
オプション指定はできないのです。
> (1) インデクス化するディレクトリを選択するときに、cgi-bin じゃない
> ところを選択する、ということはできないのでしょうか?
できます。具体的に例をあげると、
/www(root)+----------- *.html いくつか(検索対象)
+-/info/ *.html 情報関係のドキュメント(検索対象)
+-/area/ *.html 地域情報のドキュメント(検索対象)
+-/user/ *.html 各エンドユーザのホームページ(検索対象)
+-/cgi-bin/ この中に、*.cgi, *.pl 以外に *.htm の
解説系ドキュメントがあり、本来、
ホスティングサービス契約者しか見るべきでない
ドキュメントがある。(検索から除外したい)
という具合なんです。
これを、/cgi-bin/以外を各々インデクス化するように、
複数回コンフィグレータで設定すると、インデクスファイルが
複数に分かれてしまって、検索が不便になってしまうのではないのですか?
たとえば、/info/の情報は、/info/にあるnamazu.cgiでないと検索できないとか。
つまり各ディレクトリを排他的に検索するような検索システムに
なってしまうんではないかと心配しているんです。
いかがなものなのでしょうか?
> (2) mknmz のデフォルトの状態では、*.txt とか *.htm* とかいった、所定
> の拡張子のファイルしか対象にしなかったような気がするのですが、拡張子
> ではじくことはできないのでしょうか?
それは、可能です。自分で作ったファイルで検索されて欲しくないものは、
そうしました。(例:sidemenu.incとか)
上の/cgi-bin/内にある解説HTMLドキュメントというのは、
ホスティングサービス提供者側が用意しているものなので、
あまりいじりたくないのと、新しいファイルを追加されたら同じなので、
ちょっと躊躇してます。
> zak14942> でも、もしかして、逆に、サーバー上のインデックスをFTPでゲットして
> zak14942> /cgi-bin/のところだけ削除して、も一回アップロードっていう案は、
> zak14942> 馬鹿げた発想ですか?
> zak14942> そもそも、インデックスがどんな形なのか全く知らないので。。。
>
> 可能だと思います。ただし、インデックスはバイナリファイルなので、単純に
> 削除することはできません。やるとしたら、NMZ.t の該当部分を -1 にするの
> がよいでしょう。
>
> # NMZ.r を見て、cgi-bin のファイルが N 番目にあったら、NMZ.t のオフセッ
> # ト 4*N バイト目からの 4 バイトを ff にする
>
> ちょっとしたスクリプトを組めれば、難しくはないですが…
有用な情報をありがとうございます。
これは検討する価値ありですね。
も、問題は、その「ちょっとしたスクリプト」ですわ。
何しろ、CGI初心者なので、あ、でもローカルでやることを考えたら、
言語は何でもいいわけか。。。
でも、せっかくならサーバ上で済ませちゃえば、ダウン、アップの
手間が省けますね。
いいアイデアありがとうございます。
おかげさまで、いろいろな選択肢が増えてきました。
どうもありがとうございます。
-----
磯部克司
Katsuji Isobe <zak14942@xxxxxxxxxxxxxx>