Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: prnmz の連結について



 From: 壷井 敏史 <tsuboi@xxxxxxxxxxxxxxxxxx>
 Subject: [namazu-users-ja] prnmz の連結について
 Date: Mon, 31 Dec 2001 02:19:09 +0900

 > そこでmknmzはそれぞれべつにindexingをしてもマージできるみたいですが、
 > prnmzは、マージできるのでしょうか?

原理的に不可能です。最初から (NMZ.field.link の作成から) やり直す
必要があります。


 > http://www.namazu.org/ml/namazu-devel-ja/msg01288.html
 > こちらに紹介されている
 > (3) スコアリングにURIの特徴(URIの長さや index.html で終っている
 > など)を考慮するようにした。
 > も利用しようと考えていますが、
 > これも別々にmknmzをかけた後、マージすることができるのでしょうか?

これは、namazu あるいは namazu.cgi がスコアリング計算の時に動的に
計算しますので、インデックス時には関係ありません。

なお、これらのスコアリング機能では極めて実験的な(初歩的な)ことしか
やっていません。あくまで、それぞれのスコアリング改良アイデア実装の
ためのたたき台的なものだと考えてください。それにも関わらず、ソース
コードでやっている意味を理解されないまま使っても、あまり効果的では
ない(むしろ逆効果) かとおもいます。念のためコメント(というか注意喚
起) しておきます。


 > 一番いいのは、一つのディレクトリに5万ディレクトリをつくることができれば
 > 問題ないのですが、無理っぽいですね。

これは単に、wget で取ってきて保存するときに、

  /cache1/aaa.jp/
          bbb.jp/
  /cache2/ccc.jp/
          ddd.jp/
  /cache3/eee.jp/
          fff.jp/

などとなるように適当にバランシングしてやればいいだけのことではない
でしょうか。ラッパースクリプトはさほど難しくなさそうな気がします。
--
馬場  肇 ( Hajime BABA )                  E-mail: hajime.baba@xxxxxxxxx
国立天文台 天文学データ解析計算センター
--