namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Distributed Namazu



國頭です。

▲時刻 Thu, 5 Nov 1998 12:56:47 +0900 に
▲Satoru Takabayashiさんの出した
▲Message-ID <19981105125649P.satoru@xxxxxxxxxxxxx>の
▲[namazu:01556] Re: Distributed Namazu という話題では...
▲(詳しくは <19980819022340N.ccsatoru@xxxxxxxxxxxxxxxxxx> も見てね)

Satoru> Satoru Takabayashi <ccsatoru@xxxxxxxxxxxxxxxxxx> wrote:
>> リモートとのやり取りを 2回に分けて、1回目に検索結果の IDとスコアの
>> データ (そんなに大きくない) をもらって、それを元に全体をマージした
>> 後、結果表示に必要な要約をもらうようにすることも考えられますが、や
>> り取りが複雑になるので難しいところです。

Satoru> これ、やってみました。検索時に

げ、先にやられてしまった。

ぼくは次のようなサーバ間連携プロトコルを考えていました。

--輪講資料から抜粋--------------------------------
query の要求を出すものをC(Client) 、検索結果を返すもの(複数)を
S(Server) とする。また、ユーザが要求するURL 数を N とする。

1. C はS にquery 要求をする。
  その際、検索結果としてはURL のみを要求し、さらに
  各キーワードの出現頻度も要求する。
  S の数を Snとすると、各サーバに対して最高N/Snの検索結果を要求
  する。

2. C は S に query 要求のキーワード、及び
  すべての S からのキーワードの出現頻度の総和を渡して、
  再スコアリングを要求する。
  また、得られた検索結果のうち、ある一定のスコア以下のものが欲しい場
  合にはそのスコア MAX も送る。

3. C は 2 で得られた S からの結果をマージソートする。もし、
  検索結果数が N 未満の場合には 2 を繰り返す。
-------------------------------------

「次の10件」とかのときには2、3. を繰り返すだけで良い。

  ====================================================================
|| 國頭 吾郎 (Goro Kunito) Tel 03-3812-2111 or 03-3814-4251(ext.6761) ||
||   東京大学工学系研究科電子情報工学専攻  羽鳥・相澤研究室 博士2年  ||
||                E-mail : kunito@xxxxxxxxxxxxxxxxxxx                 ||
  ====================================================================