Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
茶筅の分かち書き
- From: ML <ml@xxxxxxxxxxxxxxx>
- Date: Mon, 18 Dec 2000 10:51:04 +0900
- X-ml-name: namazu-users-ja
- X-mail-count: 01327
お世話様です。
MLです。
茶筅の分かち書きに優先順位みたいなものはあるのでしょうか?
辞書追加をしても分かち書きされないので困っております。
------------------
(例)
「とんかつ」-> 「とん」「かつ」
「タコス」 -> 「タコ」「ス」
「ビジネスホテル」 -> 「ビジネス」「ホテル」
など分かち書きされています。
・辞書
(品詞 (名詞 一般)) ((見出し語 (とんかつ)) (読み トンカツ))
(品詞 (名詞 一般)) ((見出し語 (タコス)) (読み タコス))
(品詞 (名詞 一般)) ((見出し語 (ビジネスホテル)) (読み ビジネスホテル))
-------------------
辞書もEUCに変換し、辞書作成には失敗してるとは考えにくいのですが・・・
御存知の方がいらっしゃいましたら御教授お願い致します。
namazu-2.0.5
kakasi-2.3.2
chasen-2.02
システム: linux
Namazu: 2.0.5
Perl: 5.00503
NKF: module_nkf
KAKASI: /home/sites/home/bin/kakasi -ieuc -oeuc -w
茶筌: /home/sites/home/bin/chasen -j -F '%m '
わかち書き: /home/sites/home/bin/kakasi -ieuc -oeuc -w
言語: ja_JP.SJIS
文字コード: euc
CONFDIR: /home/sites/home//etc/namazu
LIBDIR: /home/sites/home//share/namazu/pl
FILTERDIR: /home/sites/home//share/namazu/filter
TEMPLATEDIR: /home/sites/home//share/namazu/template
対応メディアタイプ:
application/x-bzip2
application/x-compress
application/x-gzip
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; x-type=rfc
text/x-roff