namazu-ml(avocado)

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Phrase search (Re: [Q] OpenText Style?)

From: Kenji Suzuki <kenji@xxxxxxxxxxxxxxxx>
Date: Fri, 22 May 1998 15:30:30 +0900
X-ml-name: namazu
X-mail-count: 00684
References: Your message of "Fri, 22 May 1998 14:39:58 +0900" <05400527124324@po.ganseki.ne.jp>

At 3:12 PM +0900 5/22/98, Satoru Takabayashi wrote:
> Kenji Suzuki <kenji@xxxxxxxxxxxxxxxx> wrote:
>
> >> フレーズ検索の実装に関して何かアイディアがあったら教えてください。
> >
> >文書中の位置情報(何単語目か)も index すればいいのでは？
> >
> >キーワード 文書番号:出現位置
> >if         100:1,..........
> >i          100:2,..........
> >like       100:3,..........
> >a          100:4,..........
> >
> >みたいな感じでどうでしょうか？
>
> うーん、最初に思いついたのはこの方法なのですが (「サーチエンジン徹
> 底活用術[1]」にもこれと同じような図があります)、これだとインデック
> スが巨大になる気がします ("the" とか)。私が先ほど示した方法も大差
> ないかもしれませんが。
>
> # フレーズ検索用のインデックスを別にしたいという考えもあります。

それなら同じことですが，文書番号と位置情報は1対1対応して
いますから，
インデックス1(キーワード)とインデックス2(位置情報)にわければ
どうでしょうか？

インデックス1:
if         100,..........
i          100,..........
like       100,..........
a          100,..........

インデックス2:
if         1,..........
i          2,..........
like       3,..........
a          4,..........

これだとインデックス・サイズはさらに大きくなりますが．．．

 ______________________________________________________________
 Kenji Suzuki  <kenji@xxxxxxxxxxxxxxxx>     GANSEKI Users Group
  福井最強の検索エンジン http://www.inseki.gr.jp/‾kenji/search/
 _______________ Inseki is Not ganSEKI internet service. :-) __

References:
- Re: Phrase search (Re: [Q] OpenText Style?)
  - From: Kenji Suzuki
- Re: Phrase search (Re: [Q] OpenText Style?)
  - From: Satoru Takabayashi

Prev by Date: Re: Phrase search (Re: [Q] OpenText Style?)
Next by Date: Re: Namazu v1.1.2.3 released! (Re: tknamazu 1.06 release)
Previous by thread: Re: Phrase search (Re: [Q] OpenText Style?)
Next by thread: Re: Phrase search (Re: [Q] OpenText Style?)
Index(es):
- Date
- Thread