Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 「プロ野球チームをつくろう」検索問題



>> 一文字目が漢字じゃないとmkkanwaは登録してくれません。
>はい、そうです。それは KAKASI の仕様です。
>ひらがなやカタカナから始まる単語でも登録できるように
>拡張できないかと考えたことがありますが、
今はフレーズ検索があるのでべつにできなくとも通常困らないと思います。
kakasiの本来の用途を考えれば当然の仕様だと思います:-)
出現確率の高い単語で構成されたフレーズとかはきついですが。
例:
{ 空 の 白 } ←「の」はたいていの文章に入っている。

>> 解決策はkakasiが「を」を特別扱いしないことと
>いえ、どちらかといえばむしろ逆で、namazu 側で検索文字列でも「を」
>を特別扱いするようにすることではないでしょうか。mknmz で ChaSen を
これについては僕の勝手な思いこみで、
kakasiは「中途半端に文章を解釈しようとせず、
ひらがな語については解釈をすっぱりあきらめている」
という「いさぎよい仕様」だと思ってただけです・・・

これは全くの雑談ですが、
kakasiがもし今も原作者の手で保守されているとしたら、
翻訳ソフトのようにプロキシとして動作して年齢を設定すると
自動的にrubyタグを埋め込んで子どもには読めない字に
自動的にふりがなを振るみたいな方向に発展していたでしょうね。
子どもでも「猟奇殺人」に関するページを読めたりできるし。
#そんなページを子どもが読んでいいかどうかはまた別の問題ですが:-)

個人的に気になったのはオリジナルのメールが
仕事をしている大人の文章にはとても見えなかったことですが・・・
それとも子どもなのかな?何の代表だったんだろう?