namazu-ml(ring)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: インデックスの作り方について
こんばんは。佐川です。
(はじめまして、かな?)
以下の引用部分は' Totsuka Ryutaro 'さんの
"[namazu 1306] インデックスの作り方について"からのものです。
(snip)
>ある助平な人?からのクレームですが「すけべ」と入力して検索する
>と、結果を返してくるのですが、該当文書には「すけべ」が含まれて
>いないようなのです。
>どうも、「す」と「けべ」で or 検索しているようです。
>この元文書がhtml書式になっていない事が、問題なのでありましょうか?
分かち書き用のソフトの問題です。
だから、関係ないと思います。
>インデックス作成時のコマンドは、
>mknmz -D -K -u -W -O C:\usr\local\namazu\index\za d:\yorozu\
>です。
とのことから、インデックスの作成は Windows 上で行っているので
kakasi を用いていると思います。
kakasi 分かち書きパッチのドキュメント
(kakasi-ext.tar.gz の KAKASI.DOC)を読むと、
> 5. 制限・コメント
>
>・単語確定にちゃんと辞書を引く分、動作はあまり速くありません。
>・ひらがな(カタカナ)ばかりの文章には依然として弱いです。
(以下略)
とあるので、"すけべ"という語を
一語として認識させるために、
kakasi 辞書に単語を追加するのが、よろしいかと思います。
# かといって、「すけべ」を追加すると、「すけべ」のを含む他の
# 言葉にヒットするかもしれません。
# ex. 「めし」を登録したら、「うら:めし:や:〜」になったとか。(汗)
辞書の作り方は、
[namazu 1003] Re: KAKASIのカスタマイズ
http://ml.namazu.org/namazu-ml/ring/msg00997.html
や kakasi の JISYO というファイルを参考にしてください。
そうそう、辞書を作り直したらインデックスも作り直す必要がありますから
忘れずに。
でわ。
・・・・‥‥‥‥‥‥…………━━━━━☆
佐川 昭宏 mailto: sagawa@xxxxxxxxxx
http://pelican.sohgoh.net/
PHP3 を使ったメールソフト ↑99/11/25
"Pelican Web Mail"公開中!! ─┘ v1.0.60