Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: kakasi での分かち時の長音の扱いについて教えてください
From: Kudoh Wataru <kudoh@xxxxxxxxxxxxxxxxxxxx>
Subject: [namazu-users-ja] Re: kakasi での分かち時の長音の扱いについて教えてください
Date: Tue, 15 Jan 2002 09:19:21 +0900
> 馬場さん>という処理を行っているからです。src/kakasi.c#kakasi_do() の中です。
> 馬場さん>つまりそうなるのは現在のところは仕様ということになります。しかしな
> 馬場さん>がら、やはり直せるようなら直しておいた方が良いかとおもいます。
>
> 仕様というのであれば、仕方が無いですね。Kakasiをいじりたくは無いので、
> 話術(仕様と言ってユーザを納得させる。ひらがな検索は無しとする。等)で
> 何とかしたいと今は考えています。
KAKASI 用のメーリングリストには投げたのですが、以下のパッチを試し
てみてください。少なくとも長音の問題は解決できるかとおもいます。
--- src/kakasi.c 2001/09/02 11:43:21 1.20
+++ src/kakasi.c 2002/01/13 06:21:06
@@ -559,7 +559,13 @@
} else if (c[0].c1 == 0xa5) {
ptype = 5;
} else if ((c[0].c1 == 0xa1) && (c[0].c2 == 0xbc)) {
- ptype = 5;
+ if (pctype == 5) {
+ ptype = 5;
+ } else if (pctype == 6) {
+ ptype = 6;
+ } else {
+ ptype = 5;
+ }
} else {
ptype = 4;
}
ただし、ひらがな一般の分かち書き問題は依然として残るので、十分では
ないかもしれません。
> 馬場さん>し方に頭を悩ませるより、ひらがなだけからなる語で検索できるようにす
> 馬場さん>るのは後回しにしてでも他にやること、つまりとにかくなんでもいいから
> 馬場さん>動く全文検索システムを作るという目標があったので、こういう処理にし
> 馬場さん>たという経緯があります。昔話ということで勘弁してください。
> 私がお客に「ご要望の80%ならなんとかなります。しかし残り20%を実現す
> るには倍の期間と金が掛かりますヨ」と説明しているのに、なんか似ている気がし
> ます。
# 1996年当時は Namazu のような便利なものがなかったものですから...
--
馬場 肇 ( Hajime BABA ) E-mail: hajime.baba@xxxxxxxxx
国立天文台 天文学データ解析計算センター
--