namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Phrase search (Re: [Q] OpenText Style?)



At 3:12 PM +0900 5/22/98, Satoru Takabayashi wrote:
> Kenji Suzuki <kenji@xxxxxxxxxxxxxxxx> wrote:
>
> >> フレーズ検索の実装に関して何かアイディアがあったら教えてください。
> >
> >文書中の位置情報(何単語目か)も index すればいいのでは?
> >
> >キーワード 文書番号:出現位置
> >if         100:1,..........
> >i          100:2,..........
> >like       100:3,..........
> >a          100:4,..........
> >
> >みたいな感じでどうでしょうか?
>
> うーん、最初に思いついたのはこの方法なのですが (「サーチエンジン徹
> 底活用術[1]」にもこれと同じような図があります)、これだとインデック
> スが巨大になる気がします ("the" とか)。私が先ほど示した方法も大差
> ないかもしれませんが。
>
> # フレーズ検索用のインデックスを別にしたいという考えもあります。

それなら同じことですが,文書番号と位置情報は1対1対応して
いますから,
インデックス1(キーワード)とインデックス2(位置情報)にわければ
どうでしょうか?

インデックス1:
if         100,..........
i          100,..........
like       100,..........
a          100,..........

インデックス2:
if         1,..........
i          2,..........
like       3,..........
a          4,..........

これだとインデックス・サイズはさらに大きくなりますが...

 ______________________________________________________________
 Kenji Suzuki  <kenji@xxxxxxxxxxxxxxxx>     GANSEKI Users Group
  福井最強の検索エンジン http://www.inseki.gr.jp/‾kenji/search/
 _______________ Inseki is Not ganSEKI internet service. :-) __