Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Namazu での検索性能向上方策に関する質問



足立様

こんにちは。
山本@松下コンピュータシステムです。

私も、

System: solaris-8
Namazu: 2.0.5
Perl:   5.006
KAKASI: 2.3.2

の環境で使用していたときに一つの言葉がバラバラになり、検索できない事がありました。

この方法が有効かどうか分かりませんが、私の場合、以下のようにして検索してます。

検索したい項目欄に

/圧縮/

と入力して検索しております。

一度、試してみて頂けませんか。



adachi> はじめまして、足立と申します。
adachi> 
adachi> 今回初めて Namazu による検索システムの構築を行って
adachi> おりますが、検索結果に満足できずもう少し検索結果の
adachi> 向上が出来ないか質問です。
adachi> 
adachi> MLの過去ログなども見てみましたが、解決方法が
adachi> 見つからなかったのでアドバイス&ご教授をお願いします。
adachi> 
adachi> 
adachi> [質問1]
adachi> 
adachi> 検索キーワードにある単語(下記の例では、圧縮)を入力し検索ボタンを
adachi> 押したところ「検索式にマッチする文書はありませんでした。」になって
adachi> しまいました。
adachi> ちなみに部分一致検索(前方、後方、中間のいずれも)を行った場合は、
adachi> 検索式にマッチする文書が検索できます。
adachi> 
adachi> ------------------------------------------------------------------------
adachi> 検索結果
adachi> 
adachi> 参考ヒット数: { [ 圧: 0 ] [ 縮: 0 ] :: 0 } 
adachi> 
adachi> 検索式にマッチする文書はありませんでした。
adachi> 
adachi> 検索のコツ
adachi> 
adachi> 検索がうまくいかないときは、次の点を確認してください。 
adachi> 
adachi>     ・・・・中略・・・・
adachi>     ・日本語がでたらめにわかち書きされてしまう
adachi>       { [ 最: 1 ] [ 新: 0 ] [ 情: 0 ] [ 報: 0 ] :: 0 } のように、でたらめ
adachi>       にわかち書きされることがあります。 これは、そもそも最新情報という言
adachi>       葉が検索対象に含まれない ことを意味します。検索はあきらめましょう。 
adachi> ------------------------------------------------------------------------
adachi> 
adachi> 上記の例では、「圧縮」という単語自体では検索キーとしてインデックス
adachi> ファイルが作成されていないようです。
adachi> 
adachi> # ちなみに、Namazu を利用している他社(例えば、関西電力[http://www.kepco.co.jp/])
adachi> # のサイト内キーワード検索では「圧縮」で文書が検索できました。
adachi> 
adachi> 
adachi> 色々調べたところ分かち書きに kanwadict というバイナリ形式の辞書を
adachi> 利用しているようですが、その辞書を作成する元ファイルである、
adachi> kakasidict (テキストファイル)の内容を調べても「圧縮」という単語
adachi> は登録されていました。
adachi> 
adachi> 
adachi> そこで質問です。
adachi> なぜ、「圧縮」という単語でインデックスが作成されないようでしょうか?
adachi> また、単語(熟語)でのインデックスをより多く作成するにはどのようにしたら
adachi> 良いのでしょうか?
adachi> 
adachi> 
adachi> [質問2]
adachi> 
adachi> わかち書きの問題かも知れませんが、調べたい単語を以下のように
adachi> それぞれ入力した場合、当然、検索結果(ヒット件数)に違いが生じますね。
adachi> 
adachi>  単語     -----> 単一単語検索
adachi>  *単語    --+
adachi>  単語*    --+--> 部分一致検索
adachi>  *単語*   --+
adachi> 
adachi> 今回試した結果では、質問1の「圧縮」以外の単語でも単一単語検索を
adachi> した場合、ほとんど「検索式にマッチする文書はありませんでした。」
adachi> になってしまいました。
adachi> ちなみに部分一致検索(前方、後方、中間のいずれも)を行った場合は、
adachi> 検索式にマッチする文書が検索できます。
adachi> 
adachi> # すなわち、検索対象となる全文書の中には相当数入力した単語要素は
adachi> # 含まれているはずなのに、単一単語検索では検索されない事が
adachi> # 多いのです。
adachi> 
adachi> 
adachi> そこで質問です。
adachi> ユーザへの利便性のため入力された単語の前後にアスタリスク
adachi> を付けて中間一致検索を自動的行うようなことが簡単に出来ない
adachi> ものでしょうか?
adachi> 
adachi> 
adachi> 環境は、以下の通りです。
adachi> System: solaris
adachi> Namazu: 2.0.5
adachi> Perl:   5.006
adachi> KAKASI: 2.3.2
adachi> 
adachi> -----------------------------------------------------------------
adachi> ◆  足立  嘉浩   (Yoshihiro Adachi)                            ◆
adachi> ◇    (株)電力計算センター   技術本部   技術企画室             ◇
adachi> ◆  TEL: 03-3295-5751(直通)  FAX: 03-3295-5753                 ◆
adachi> ◇  E-mail: adachi@xxxxxxxxx    URL: http://www.dcc.co.jp/     ◇
adachi> -----------------------------------------------------------------
adachi> 
∬ω================================================================ω∬
 山本  秀吉 ◆ Mailto: hide@xxxxxxxxxxxxx 
 松下コンピュターシステム株式会社   サポートセンター
 Phone.+81-6-6881-0670			                ξ
 Fax.  +81-6-6881-0630 Pana/Van.7-736-212               ■P (JAVA)
 URL:  http://www.panasonic.co.jp/mac                   ―
∬Ω----------------------------------------------------------------Ω∬