namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Perl version search program (Re: Tawagoto?)
- From: Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx>
- Date: Fri, 6 Mar 1998 13:34:59 +0900
- X-ml-name: namazu
- X-mail-count: 00331
古川です。
>> On Wed, 4 Mar 1998 23:44:21 +0900, Satoru Takabayashi <ccsatoru@xxxxxxxxxxxxxxxxxx> said:
> 古川さんの方法だと、おそらく KAKASI を呼び出して分解するのと同じ結
> 果が得られるのではないかと思います (素晴らしい)。 C言語版も見習っ
> てこの方法を実装することにします。
例えば、kakasi の標準の辞書には「大阪大学」はあります。しかし、たまたま
「大阪」があって「大阪大学」が無い文書群だった場合、「大阪大学」を検索
しようとすると、「大阪」「大学」に分かれてしまいますから、kakasi を呼び
だした場合にはヒットしないものが、ヒットするケースがあります。
というわけで、「同じ結果」とはいかず、強いていえば、
「『文書群に存在する語群と、きっかり同じ辞書を持った kakasi』と同じ結果」
ということでしょうか。
それとは別に、現在の perl 版のバグとして、英単語にも同じ処理をしてしま
っています。これは直します。
--
ヤマハ(株)ピアノプレーヤ設計課
古川 令
furukawa@xxxxxxxxxxxxxxxx