namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
 Re: Phrase search
- From: Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx>
 
- Date: Fri, 22 May 1998 21:39:25 +0900
 
- X-ml-name: namazu
 
- X-mail-count: 00689
 
古川です。
>> On Fri, 22 May 1998 20:46:12 +0900, chida@xxxxxxxxxxxxx (CHIDA Makoto) said:
  >> 例えば「数字だけの語は削る」「1 byte 1 文字だけの語は削る」「ひら
  >> がなを含む語は削る」など、いろいろなルールをつけていくと、
  >   こうしたルール付でかなり、削っていけると思いますが、
まあ、私のは、「叩き台」 (叩かれ台?) ということで…
  > 例えば、人名の検索なんかだと、「ひらがなを含む語は削る」というルールで、
  > "山川  わか子"さんの"わか子"がはじかれるようだと、こまったりします。
「わか子」を拾うためには、「ひらがなだけの語は削る」というルールは無し
にする必要がありますね。
すると、「ひらがなだけの語は削る」というルールが残りますが、それだと、
「わかこ」という名前は、やっぱり拾えません。しかし、このルールも無しに
してしまうと、「です」「ます」など、とたんに語数が増えてしまいます。
(それでも大丈夫な環境の方もいらっしゃるとは思いますが) どこかで線引する
ことにはなるでしょう。
ただ、ここで、私が「ひらがなを含む語は削る」と言っているのは、「フレーズ
検索の対象としない」だけであって、and 検索は効くので、この例の「わか子」
のような、それほど多くない名前では、実際には、それほどひどいことにはな
らないかと思います。
# それ以前の問題として、kakasi を通すと「わか子」という語は、意図通りに
# わかち書きされないです。
  >  "一致行の表示"があれば便利と思ったのは、専用線の接続ではなく、on-demand
  > のdial-upでインターネットに接続している場合などに関係します。
  >   localでnamazuで検索して、検索結果をインターネットにみにいくわけなので、
  > なるべく接続回数を減らしたいわけです。(じつに、マズシイ話ですみません。^^;)
環境は千差万別なので、目的に合ったオプションが指定できれば、それでよい
と思います。
# 私が一番フレーズ検索したいと思うのは「都田」 (ローカルネタでした)
-- 
                                        ヤマハ(株)ピアノプレーヤ設計課
                                                              古川 令
                                             furukawa@xxxxxxxxxxxxxxxx