namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Phrase search



古川です。

>> On Fri, 22 May 1998 20:46:12 +0900, chida@xxxxxxxxxxxxx (CHIDA Makoto) said:
  >> 例えば「数字だけの語は削る」「1 byte 1 文字だけの語は削る」「ひら
  >> がなを含む語は削る」など、いろいろなルールをつけていくと、

  >   こうしたルール付でかなり、削っていけると思いますが、

まあ、私のは、「叩き台」 (叩かれ台?) ということで…


  > 例えば、人名の検索なんかだと、「ひらがなを含む語は削る」というルールで、
  > "山川  わか子"さんの"わか子"がはじかれるようだと、こまったりします。

「わか子」を拾うためには、「ひらがなだけの語は削る」というルールは無し
にする必要がありますね。

すると、「ひらがなだけの語は削る」というルールが残りますが、それだと、
「わかこ」という名前は、やっぱり拾えません。しかし、このルールも無しに
してしまうと、「です」「ます」など、とたんに語数が増えてしまいます。
(それでも大丈夫な環境の方もいらっしゃるとは思いますが) どこかで線引する
ことにはなるでしょう。

ただ、ここで、私が「ひらがなを含む語は削る」と言っているのは、「フレーズ
検索の対象としない」だけであって、and 検索は効くので、この例の「わか子」
のような、それほど多くない名前では、実際には、それほどひどいことにはな
らないかと思います。


# それ以前の問題として、kakasi を通すと「わか子」という語は、意図通りに
# わかち書きされないです。


  >  "一致行の表示"があれば便利と思ったのは、専用線の接続ではなく、on-demand
  > のdial-upでインターネットに接続している場合などに関係します。
  >   localでnamazuで検索して、検索結果をインターネットにみにいくわけなので、
  > なるべく接続回数を減らしたいわけです。(じつに、マズシイ話ですみません。^^;)

環境は千差万別なので、目的に合ったオプションが指定できれば、それでよい
と思います。

# 私が一番フレーズ検索したいと思うのは「都田」 (ローカルネタでした)

-- 

                                        ヤマハ(株)ピアノプレーヤ設計課
                                                              古川 令
                                             furukawa@xxxxxxxxxxxxxxxx