Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: ひらがなの中の " ー " の検索
- From: knok@xxxxxxxxxxxxx (NOKUBI Takatsugu)
- Date: Mon, 4 Dec 2000 18:23:52 JST
- X-ml-name: namazu-users-ja
- X-mail-count: 01284
ChaSen の install については他の方がフォロして下さっているのでおいて
おくとして...
<200012040247.AA00758@xxxxxxxxxxxxxxxxxx>の記事において
ml@xxxxxxxxxxxxxxxさんは書きました。
>> tsuika.dic の中身は
>>
>> (品詞 (名詞 固有名詞 組織)) ((見出し語 (きしみーる 3577)) (読み キシミール))
>>
>> としております。
多分、
(品詞 (名詞 固有名詞 組織)) ((見出し語 (きしみーる)) (読み キシミール))
でも良いように思います。ところで、ファイルの内容は日本語 EUC で書か
ないといけないのですが、それは大丈夫でしょうか? 最初の辞書構築失敗は、
なんとなくその辺りがあやしいような気がします。
あとは作成された辞書をきちんと適切な位置にコピーしたかどうか、ですね。
>> もう一つ質問なのですが、
>> (品詞 (名詞 固有名詞 組織)) ((見出し語 (きしみーる 3577)) (読み キシミール))
>> ^^^^^^^
>> この数字は一体なんなのですか?
>> 適当に 3577 としましたが、意味が分かりません。
これは品詞コストの値で、きちんと沢山の文章を解析させないと正当な値は
出せないです。これを省略すると 65535 が指定されたものとして扱われるの
ですが、とりあえずはそれで良いように思います。
--
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx