Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 全角文字のフレーズ検索のバグ



竹迫です。

寺西さん、いろいろと commit ありがとうございます。

>Tadamasa Teranishi wrote:
>> 
>> フレーズ検索はほとんど使わないのですが、たまたまバグを見つけた
>> ので修正しました。(開発版)
>> 
>> 全角文字のフレーズ検索を行うと正しく検索できません。
>> 
>> 例えば http://www.namazu.org/ で {開発 環境} で検索すると、
>> 
>> References: { [ 開発: 51 ] [ : 0 ] [ : 0 ] [ 環境: 17 ] :: 0 }
>> 
>> のような結果になります。真ん中に単語と誤認されたコードがあり、
>> これが 0 件のためヒットしません。
>
>http://www.namazu.org/ では再現するのですが、namazu-2.0.12 で手元の
>データでチェックしたところ再現しませんでした。

この件ですが、寺西さんのパッチを当てていない namazu-2.0.12 で試したところ、
環境変数 LANG の値によって、日本語のフレーズ検索が正常に動作したり・
しなかったりするようです。

--------------------------------------------------------------------------
■ フレーズ検索の分かち書きが正常に行われる場合 (LANG=C)
--------------------------------------------------------------------------
# export LANG=C
# namazu "{開発 環境}" /storage/namazu/www/index/www.namazu.org.ja
--------------------------------------------------------------------------

Results:

References:  {  [ 開発: 51 ]  [ 環境: 17 ]  :: 1 }

 Total 1 documents matching your query.

1. Namazu FAQ (old): Namazu はなぜフリーソフトウェアなのですか (score: 9)
Author: webmaster@xxxxxxxxxx
Date: Tue, 30 May 2000 15:19:00
フリーソフトウェアの文化に貢献したいと考えるからです。 ちなみに Namazu の
開発環境は Plamo Linux + XFree86 + Mule + gcc + Perl + Apache と OS を含め
すべてフリーソフトウェアで揃えられています。
/storage/namazu/www/htdocs/FAQ-old.html.ja#why-free (750 bytes)



Current List: 1 - 1


--------------------------------------------------------------------------
■ フレーズ検索の分かち書きが正常に行われない場合 (LANG=ja_JP.eucJP)
--------------------------------------------------------------------------
# export LANG=ja_JP.eucJP
# namazu "{開発 環境}" /storage/namazu/www/index/www.namazu.org.ja
--------------------------------------------------------------------------
検索結果

参考ヒット数:  {  [ 開発: 51 ]  [ : 0 ]  [ : 0 ]  [ 環境: 17 ]  :: 0 }

検索式にマッチする文書はありませんでした。
--------------------------------------------------------------------------

karin.namazu.org サーバ上の namazu-2.0.10 でも再現しました。

まだ詳しくソースを追いかけていないのですが、
nmz/wakati.c の nmz_wakati に本質的なバグが
潜んでいるのではないかと思っています。

以上、ご報告まで。

--
  株式会社ドリーム・アーツ 製品企画開発本部
    竹迫 良範  <takesako@xxxxxxxxxx>