namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Phrase search (Re: [Q] OpenText Style?)
- From: Kenji Suzuki <kenji@xxxxxxxxxxxxxxxx>
- Date: Fri, 22 May 1998 15:30:30 +0900
- X-ml-name: namazu
- X-mail-count: 00684
- References: Your message of "Fri, 22 May 1998 14:39:58 +0900" <05400527124324@po.ganseki.ne.jp>
At 3:12 PM +0900 5/22/98, Satoru Takabayashi wrote:
> Kenji Suzuki <kenji@xxxxxxxxxxxxxxxx> wrote:
>
> >> フレーズ検索の実装に関して何かアイディアがあったら教えてください。
> >
> >文書中の位置情報(何単語目か)も index すればいいのでは?
> >
> >キーワード 文書番号:出現位置
> >if 100:1,..........
> >i 100:2,..........
> >like 100:3,..........
> >a 100:4,..........
> >
> >みたいな感じでどうでしょうか?
>
> うーん、最初に思いついたのはこの方法なのですが (「サーチエンジン徹
> 底活用術[1]」にもこれと同じような図があります)、これだとインデック
> スが巨大になる気がします ("the" とか)。私が先ほど示した方法も大差
> ないかもしれませんが。
>
> # フレーズ検索用のインデックスを別にしたいという考えもあります。
それなら同じことですが,文書番号と位置情報は1対1対応して
いますから,
インデックス1(キーワード)とインデックス2(位置情報)にわければ
どうでしょうか?
インデックス1:
if 100,..........
i 100,..........
like 100,..........
a 100,..........
インデックス2:
if 1,..........
i 2,..........
like 3,..........
a 4,..........
これだとインデックス・サイズはさらに大きくなりますが...
______________________________________________________________
Kenji Suzuki <kenji@xxxxxxxxxxxxxxxx> GANSEKI Users Group
福井最強の検索エンジン http://www.inseki.gr.jp/‾kenji/search/
_______________ Inseki is Not ganSEKI internet service. :-) __