namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Phrase search
- From: Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx>
- Date: Fri, 22 May 1998 21:39:25 +0900
- X-ml-name: namazu
- X-mail-count: 00689
古川です。
>> On Fri, 22 May 1998 20:46:12 +0900, chida@xxxxxxxxxxxxx (CHIDA Makoto) said:
>> 例えば「数字だけの語は削る」「1 byte 1 文字だけの語は削る」「ひら
>> がなを含む語は削る」など、いろいろなルールをつけていくと、
> こうしたルール付でかなり、削っていけると思いますが、
まあ、私のは、「叩き台」 (叩かれ台?) ということで…
> 例えば、人名の検索なんかだと、「ひらがなを含む語は削る」というルールで、
> "山川 わか子"さんの"わか子"がはじかれるようだと、こまったりします。
「わか子」を拾うためには、「ひらがなだけの語は削る」というルールは無し
にする必要がありますね。
すると、「ひらがなだけの語は削る」というルールが残りますが、それだと、
「わかこ」という名前は、やっぱり拾えません。しかし、このルールも無しに
してしまうと、「です」「ます」など、とたんに語数が増えてしまいます。
(それでも大丈夫な環境の方もいらっしゃるとは思いますが) どこかで線引する
ことにはなるでしょう。
ただ、ここで、私が「ひらがなを含む語は削る」と言っているのは、「フレーズ
検索の対象としない」だけであって、and 検索は効くので、この例の「わか子」
のような、それほど多くない名前では、実際には、それほどひどいことにはな
らないかと思います。
# それ以前の問題として、kakasi を通すと「わか子」という語は、意図通りに
# わかち書きされないです。
> "一致行の表示"があれば便利と思ったのは、専用線の接続ではなく、on-demand
> のdial-upでインターネットに接続している場合などに関係します。
> localでnamazuで検索して、検索結果をインターネットにみにいくわけなので、
> なるべく接続回数を減らしたいわけです。(じつに、マズシイ話ですみません。^^;)
環境は千差万別なので、目的に合ったオプションが指定できれば、それでよい
と思います。
# 私が一番フレーズ検索したいと思うのは「都田」 (ローカルネタでした)
--
ヤマハ(株)ピアノプレーヤ設計課
古川 令
furukawa@xxxxxxxxxxxxxxxx