namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: plan for Namazu v2.0



すぎうらしろうです。

<199905041312.WAA17638@xxxxxxxxxxxxxx>の記事において
satoru-t@xxxxxxxxxxxxxxxxxxさんは書きました。

>> 現在、考えている案は次の通りです。足りない点があれば提案して
>> ください。

mknmzでのNMZ.lockの検出を起動直後に!というのをお願いします。
現在の所、Append作業の時など対象ファイル群の検出、update、delete、
新規追加のチェックの後に行なっているようなので、これをmknmzを起動
した直後にチェックにいって頂けるとありがたいのです。
でも、検索ページを運営しながらmknmzをかける場合は逆に不便に(検索で
きない時間が長くなる)なっちゃいますね。困った。

>>   * -F オプションを拡張
>>     - URL指定に対応 (文書読み込みに lynx なりを用いればよい)

便利な機能追加はありがたいのですが、URLを指定を可能にすると今度はHTML
をパースして、どのファイルを持ってくるべきかこないべきかとか、何回層
まで持ってくるかとか、日付チェック機能付けてよとか面倒なことになりま
せんか。

>>     - 排他指定を可能にする (このディレクトリはインデックスし
>>       ないという指定)

先日、例のgawkスクリプトをかいていた時に気がついたのですが、NMZ.rを見
る限り1.4.0.0系のシンボリック扱いは、

o コマンドラインなどで指定されたヂィレクトリが、既にシンボリックリンク
  だった場合は、それを解除して本体の方のディレクトリ構成でindex化する。

o コマンドラインなどで指定されたヂィレクトリはシンボリックリンクではな
  いが、再帰的にそれを下っていくと出てくるリンクは、シンボリックリンク
  のままでindex化する

と、なっているようですね。
この状態だと、たとえばうちの環境のように /var/news/fj/ はシンボリック
リンクではないが、その下にあるディレクトリはほぼ全部がシンボリックリン
クという状態の時に、

/var/news/fj/
!/var/news/fj/mail/

とした時に、まず/var/news/fj/はシンボリックリンクではないのでそれ以下
は全部/var/news/fj/../../..というファイル名でIndex化されていくことに
なる。
しかし、"!/var/news/fj/mail/"と指定された排他ディレクトリはシンボリッ
クリンクなので、排他処理の際に本当のディレクトリ構成に戻されてしまい、
排他されない、ということになりそうです。

#あっ、後1.4.0.0用のwdnmz。

--  
      すぎうらしろう(Sugiura Shiro)      E-mail : sugiura@xxxxxxxxxxxx
      (伊)x4        <URL:http://www.kt.rim.or.jp/~sugiura/utada.html/>
       御希望の方に、もれなく less-332.tar.gz をプレゼントしています
      [     If you want to talk with me, you MUST speak Japanese     ]