namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: こんな機能があったら嬉しいのですが



BACH <pcs50516@xxxxxxxxxxxxxxxxxxxxxx> wrote:

>現在、半角スペースで区切られた場合やkakashiなどで
>わかち書きされた場合 and検索となる動作を
>namazu起動時のオプションや設定ファイルなどで or検索動作に
>なるよう選択できる。
(snip)
>例:検索キーワードに「インターネットの利用方法について」と
>指定した場合現在の動作では
>「インターネット」&「の」&「利用」&「方法」&「について」
>となり該当なしとなる確率が高い。
>これが、半角スペース分け=or検索動作の場合
>「インターネット」or「の」or「利用」or「方法」or「について」
>となり、いくつかの語が該当するファイルが検索結果として抽出される。

Namazu はキーワードでの検索を主眼としており、文をクエリーと
して用いることは今のところ考えていません。その理由は

  * 多くの場合、利用者はキーワードをひとつだけ入力して検索を
    かけるものだ 
    - わざわざ文を入力して検索をかける人は少ないだろう
  * そもそも、文をクエリーとして扱うのは難しい

です。

以前に、クエリーを ChaSen で解析し、名詞のみを抜き出して検索
をかける、という試みを行っていましたが、わかち書きを自前で行
うようにしたときにその機能はボツにしてしまいました。


>(スコア計算でのソート順に検索結果リストを表示することにより
>実用的なものになると考えます。)

スコアの計算がよほど賢くないかぎり、キーワードをすべて or で
検索すると大抵は noisy な検索結果しか得られません。

検索結果が該当ゼロとなるのを避けるために、最初に and で検索
をかけてヒット数がゼロだったら、自動的に or で再検索するとい
う方法が考えられますが、私としては該当ゼロなら該当ゼロとはっ
きり結果がわかった方が嬉しいです。

「インターネットの利用方法について」について言えば、何もヒッ
トしなかったときでも、わかち書きされた「インターネット」「の」
「利用」「方法」「について」のそれぞれの語のヒット数が参考ヒッ
ト数という形で表示されますから、それを参考に、検索し直せばよ
いでしょう。

# 検索結果が該当ゼロのときに「検索のコツ」のような文章が表示
# されるとよいかな?  よし、v2.0 ではそうしよう :)

-- Satoru Takabayashi
Mike Oldfield の新作 "Guiters" を入手しました。よいです。