Namazu-devel-ja($B5l(B)

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

BER$B05=L$N%G(B$B!<%?$NFI$_9~$_$K$D$$$F(B

From: "Hideyuki Takahashi" <k176@xxxxxxxxxx>
Date: Tue, 2 Dec 2003 23:22:35 +0900 (JST)
X-ml-name: namazu-devel-ja
X-mail-count: 03385

$B$O$8$a$^$7$F!"?^=q4[>pJsBg3X(B4$BG/$N9b66$H$$$&$b$N$G$9!#(B
(BNamazu$B$r>F$3$&$H!"2<$4$7$i$($r$$$m$$$m$H$d$C$F$$$^$9!#(B
(B
$B$5$F!"(B ML$B$N(Busers-ja$B$N(B03312$B!"%U%l!<%:8!:w$N(BHASH$BCM$X$NJQ49J}K!$N(B
$B%9%l%C%I$GOCBj$K$J$C$?7o$G5$$K$J$C$?E@$r$"$2$^$9!#(B
(B
$B$3$A$i$N%P%0$K5$$E$-!"F#86$5$s$,=q$+$l$?:G?7HG(B(13pre7)$B$N(B
$B%=!<%9$rGR8+$7$?$N$G$9$,!"$^$@$&$^$/$$$C$F$J$$$H;W$$$^$9!#(B
$B;29M$N$?$a!"4X?t$r:\$;$5$;$F$$$?$@$-$^$9!#(B
(B
$B$^$:!"(Bnmz_get_unpckw()$B$G!"(BNMZ.i$B$NBP>]8l$N0l$DL\$N%G!<%?(B
$B!JI=5-$K$D$$$FLdBj$K$J$C$?$b$N!K$r(Bn$B$KBeF~$7$F$$$^$9$,!"(B
$B$3$N;~E@$N(Bn$B$O!"%G!<%?D9!"$D$^$j%P%$%H$G$9$h$M!#(B
$B$=$l$r(Bmaxhit * 2$B$HHf3S$9$k$N$O$*$+$7$$$+$H;W$$$^$9!#(B
(B
$B6qBNE*$K!"BLL\$JNc$G$9$,!"J8=q(BID$B$,(B128$B!"%9%3%"$,(B128$B$N>l9g!"(B
$B$3$l0l$D$@$1$@$H!"(Bn$B$O(B4(byte)$B$,F~$j$^$9$M!#(B
$B$3$l$,(B500$B8D$"$k$H$9$k$H!"(B
$B!J:9J,$r9MN8$9$k$H!"J8=q(BID$B$O(B2$B8DL\$@$C$?$i2A$9$kA0$K!"(Bn$B$KJ8=q?t$rF~$l$F$*$/I,MW$,$"$j$^$9!#(B
$B$H$$$&$+!"(Bn$B$,>l=j$K$h$C$F!"%P%$%H?t$K$J$C$?$j!"%R%C%HJ8=q?t(B*2$B$K$J$C$?$j(B
$B%R%C%HJ8=q?t$K$J$C$?$j$7$F$$$k$N$G!"JL$JJQ?t$rMQ0U$7$?$[$&$,(B
$B$h$$$N$G$O$J$$$+$H;W$$$^$9!#(B
$B$3$l$,(B1$BE@!#(B
(B
$B$b$&$R$H$D$,!"(B
(B idf = log((double)document_number / (n/2)) / log(2);
(B	nmz_debug_printf("idf: %f (N:%d, n:%d)\n", idf, document_number, n/2);
$B$3$3$G$N(Bn$B$O!"$d$O$j%P%$%H?t$,F~$C$F$$$k$^$^$J$N$G$9$,!"$3$l$@$H(B
$B$d$O$j$$$1$J$$$H;W$$$^$9!#(B
$B$3$3$GMQ$$$?$$!V(Bn$B!W$O!V%R%C%HJ8=q?t(B * 2$B!W$J$N$G!#(B
(B
(B
$B$=$l$G!">e5-$N2r7h:v$G$9$,!"(Bnmz_get_unpackw()$B$G(B
$B%P%$%H?t$r5a$a$?8e!"D>8e$K!"(Bbuf = malloc(n * sizeof(int));
$B$r$9$l$PBg>fIW$@$H;W$$$^$9!#(B
$B$7$+$7!*!*M>J,$K%a%b%j$r3NJ]$9$k(B($B2DG=@-$,$"$k(B)$B$N$O$$$J$a$J$$$N$G$9$,!#!#!#(B
(B
$B3'MM$N$40U8+$r$*BT$A$7$F$*$j$^$9!#(B
$BD9J8$K$J$C$F?=$7Lu$4$6$$$^$;$s!#(B
(B
(B
(BP.S.
(B
$B!V(BBER$B05=L!W$C$F%Y%k05=L$HFI$s$G$$$$$N$G$7$g$&$+!)(B
(B
(B
$B?^=q4[>pJsBg3X(B4$BG/(B
(B
$B!!9b661Q9,(B <k176@xxxxxxxxxx>
(B
(B
(B
(B
(BNmzResult 
(Bnmz_get_hlist(int index)
(B{
(B    int n, *buf, i;
(B    NmzResult hlist;
(B    double idf = 1.0;
(B
(B    hlist.num  = 0;
(B    hlist.data = NULL;
(B    hlist.stat = SUCCESS;
(B
(B    if (-1 == fseek(Nmz.i, nmz_getidxptr(Nmz.ii, index), 0)) {
(B	hlist.stat = ERR_FATAL;
(B	return hlist; /* error */
(B    }
(B
(B    nmz_get_unpackw(Nmz.i, &n);
(B
(B    if (nmz_is_tfidfmode() &&
(B	(nmz_get_querytokennum() > 1
(B	 /* 0th token is a phrase. */
(B	 || strchr(nmz_get_querytoken(0), '\t') != NULL)) 
(B    {
(B        idf = log((double)document_number / (n/2)) / log(2);
(B	nmz_debug_printf("idf: %f (N:%d, n:%d)\n", idf, document_number, n/2);
(B    }
(B
(B    {
(B	int sum = 0;
(B	int hit;
(B	int maxhit = nmz_get_maxhit();
(B	int bersize = n;
(B	int totalsize;
(B
(B	hit = (bersize < maxhit * 2 ? bersize : maxhit * 2);
(B	buf = malloc(hit * sizeof(int));
(B	if (buf == NULL) {
(B	    nmz_set_dyingmsg(nmz_msg("%s", strerror(errno)));
(B	    hlist.data = NULL;
(B	    hlist.stat = ERR_FATAL;
(B	    return hlist;
(B	}
(B
(B	n = 0;
(B	totalsize = 0;
(B        while (totalsize < bersize) {
(B            totalsize += nmz_get_unpackw(Nmz.i, &buf[n]);
(B            n++;
(B            if (n > maxhit * 2) {
(B                hlist.stat = ERR_TOO_MUCH_HIT;
(B                free(buf);
(B                return hlist;
(B            }
(B        }
(B        n /= 2;
(B
(B	nmz_malloc_hlist(&hlist, n);
(B	if (hlist.stat == ERR_FATAL) {
(B	    free(buf);
(B	    return hlist;
(B        }
(B	
(B	for (i = 0; i < n; i++) {
(B	    hlist.data[i].docid = *(buf + i * 2) + sum;
(B	    sum = hlist.data[i].docid;
(B	    hlist.data[i].score = *(buf + i * 2 + 1);
(B	    if (nmz_is_tfidfmode()) {
(B		hlist.data[i].score = (int)(hlist.data[i].score * idf) + 1;
(B	    }
(B	}
(B        hlist.num = n;
(B	free(buf);
(B        hlist = nmz_do_date_processing(hlist);
(B    } 
(B    return hlist;
(B}

Follow-Ups:
- Re: BER$B05=L$N(B$B%G!<%?$NFI$_9~$_$K$D$$$F(B
  - From: Tadamasa Teranishi

Prev by Date: $B0lB@O:%U%#%k(B$B%?$r=$@5$7$^$7$?(B
Next by Date: Re: BER$B05=L$N(B$B%G!<%?$NFI$_9~$_$K$D$$$F(B
Previous by thread: $B0lB@O:%U%#%k(B$B%?$r=$@5$7$^$7$?(B
Next by thread: Re: BER$B05=L$N(B$B%G!<%?$NFI$_9~$_$K$D$$$F(B
Index(es):
- Date
- Thread

Namazu-devel-ja($B5l(B)

BER$B05=L$N%G(B$B!<%?$NFI$_9~$_$K$D$$$F(B

Namazu-devel-ja($B5l(B)

BER$B05=L$N%G(B$B!<%?$NFI$_9~$_$K$D$$$F(B