Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: インデックス化できない文字?
こんにちは.佐久間です.
> 初書き込みです、よろしくお願いします。
メーリングリストにHTMLメールは送らないでくださいね.
> インデックス作成もできたのですが、なぜかインデックスできていない文字が
> あります。文章が長くなって申し訳ないのですが、具体的に書きますと、
> 姓が**、名がxxである、**xxという人物の名前を検索しようとしたところ
> 検索ゼロとなりました。必ず存在するはずなので変だと思って、xxで検索すると
> ヒットして表示されるのですが、なぜかxxだけで**が表示されません。
Namazuでは,文字列が存在するか否かの判定を,全文をチェックしているわけではな
く,特定のキーワードが含まれるか否かを判定しています.
つまり,"**" や "xx" はキーワードとして認識され,それが検索されるのでしょう
が,"**xx" というキーワードは認識されず,結果含まれないという判定になってし
まいます.
このキーワードの切り出しは,kakasiやchasenを使った分かち書きで決まります.辞
書を自分で作成する事で,キーワードを決める事も出来ます.
もし,"**xx" を検索するのであれば,and検索を行うため,"** xx" として検索する
か,検索に時間は掛かりますが,正規表現を使い,"/**xx/" として検索すればヒッ
トすると思います.
=== Sakuma,Hiroaki =======================================================
BEETAS.org www.beetas.org sakuma@xxxxxxxxxx
Webmin-JP jp.webmin.com sakuma@xxxxxxxxxxxxx
Waseda Univ CS sakuma@xxxxxxxxxxxxxxx
=== "There's More Than One Way To Do It" =================================