Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: スコアリング法について



馬場@京大宇宙物理 です。

 From: kai13@xxxxxxxxxxxxxxxxxxxx
 Subject: [namazu-users-ja] Re: スコアリング法について
 Date: Tue, 13 Feb 2001 12:19:40 +0900

 > > 卒業研究でリンク解析を使ったスコアリングについて
 > > 研究を行っています(締め切り来週なのですが!)。
 > 同じことを研究している人っているんですね。
 > 私はスコアリングしていませんが、rbnamazu(Rubyのモジュール)だとスコア値を
 > 貰えるので可能ですが、perlだと良く分かりませんね。

pnamazu はそこまで見ていませんが、C 版の namazu だと、nmz/hlist.c 
と nmz/search.c と、あとは src/rcfile.c を少しいじるくらいで済みま
したけどねえ。


 > > NAMAZUで検索を行った結果のHTML(又はURL)を引数に
 > > 与えると、ソートし直した結果URL一覧を返すところま
 > > でプログラムを作ってあるのですが、これを実装する
 > > に当たって、どうしたらいいのかで困っています。
 > 実際に動いているなら見てみたいです。

そうですね。まああと一週間しかないんなら、実装はとりあえず「オレ流」
でもなんでも動かせればいいんじゃないかともおもいますが(動かす方が
先なんじゃないかともおもいますが :-)、それよりもむしろ、どういうア
ルゴリズムでスコアリングして入れ替えているのかと、どの程度定量的な
入れ替え効果の評価をしているのかは、僕も見てみたいです。



ところで、興味があれば、

  Google の秘密 - PageRank 徹底解説
  http://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html

をのぞいてみてください。まだ十分ではありませんが、Namazu での 
PageRank 計算はすでに実験済みで、いつでも使えるものではないものの
ケースを選べばそこそこ使えそうな手ごたえは得ています。

コードはそのうち namazu-devel-ja ML に投げようとおもっているのですが、
とりあえず動くだけでいろいろ揃っていませんので...
--
馬場  肇 ( Hajime BABA )            E-mail: baba@xxxxxxxxxxxxxxxxxxxxxx
京都大学理学部宇宙物理学教室 博士後期課程
--