Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Namazu での検索性能向上方策に関する質問
足立様
こんにちは。
山本@松下コンピュータシステムです。
私も、
System: solaris-8
Namazu: 2.0.5
Perl: 5.006
KAKASI: 2.3.2
の環境で使用していたときに一つの言葉がバラバラになり、検索できない事がありました。
この方法が有効かどうか分かりませんが、私の場合、以下のようにして検索してます。
検索したい項目欄に
/圧縮/
と入力して検索しております。
一度、試してみて頂けませんか。
adachi> はじめまして、足立と申します。
adachi>
adachi> 今回初めて Namazu による検索システムの構築を行って
adachi> おりますが、検索結果に満足できずもう少し検索結果の
adachi> 向上が出来ないか質問です。
adachi>
adachi> MLの過去ログなども見てみましたが、解決方法が
adachi> 見つからなかったのでアドバイス&ご教授をお願いします。
adachi>
adachi>
adachi> [質問1]
adachi>
adachi> 検索キーワードにある単語(下記の例では、圧縮)を入力し検索ボタンを
adachi> 押したところ「検索式にマッチする文書はありませんでした。」になって
adachi> しまいました。
adachi> ちなみに部分一致検索(前方、後方、中間のいずれも)を行った場合は、
adachi> 検索式にマッチする文書が検索できます。
adachi>
adachi> ------------------------------------------------------------------------
adachi> 検索結果
adachi>
adachi> 参考ヒット数: { [ 圧: 0 ] [ 縮: 0 ] :: 0 }
adachi>
adachi> 検索式にマッチする文書はありませんでした。
adachi>
adachi> 検索のコツ
adachi>
adachi> 検索がうまくいかないときは、次の点を確認してください。
adachi>
adachi> ・・・・中略・・・・
adachi> ・日本語がでたらめにわかち書きされてしまう
adachi> { [ 最: 1 ] [ 新: 0 ] [ 情: 0 ] [ 報: 0 ] :: 0 } のように、でたらめ
adachi> にわかち書きされることがあります。 これは、そもそも最新情報という言
adachi> 葉が検索対象に含まれない ことを意味します。検索はあきらめましょう。
adachi> ------------------------------------------------------------------------
adachi>
adachi> 上記の例では、「圧縮」という単語自体では検索キーとしてインデックス
adachi> ファイルが作成されていないようです。
adachi>
adachi> # ちなみに、Namazu を利用している他社(例えば、関西電力[http://www.kepco.co.jp/])
adachi> # のサイト内キーワード検索では「圧縮」で文書が検索できました。
adachi>
adachi>
adachi> 色々調べたところ分かち書きに kanwadict というバイナリ形式の辞書を
adachi> 利用しているようですが、その辞書を作成する元ファイルである、
adachi> kakasidict (テキストファイル)の内容を調べても「圧縮」という単語
adachi> は登録されていました。
adachi>
adachi>
adachi> そこで質問です。
adachi> なぜ、「圧縮」という単語でインデックスが作成されないようでしょうか?
adachi> また、単語(熟語)でのインデックスをより多く作成するにはどのようにしたら
adachi> 良いのでしょうか?
adachi>
adachi>
adachi> [質問2]
adachi>
adachi> わかち書きの問題かも知れませんが、調べたい単語を以下のように
adachi> それぞれ入力した場合、当然、検索結果(ヒット件数)に違いが生じますね。
adachi>
adachi> 単語 -----> 単一単語検索
adachi> *単語 --+
adachi> 単語* --+--> 部分一致検索
adachi> *単語* --+
adachi>
adachi> 今回試した結果では、質問1の「圧縮」以外の単語でも単一単語検索を
adachi> した場合、ほとんど「検索式にマッチする文書はありませんでした。」
adachi> になってしまいました。
adachi> ちなみに部分一致検索(前方、後方、中間のいずれも)を行った場合は、
adachi> 検索式にマッチする文書が検索できます。
adachi>
adachi> # すなわち、検索対象となる全文書の中には相当数入力した単語要素は
adachi> # 含まれているはずなのに、単一単語検索では検索されない事が
adachi> # 多いのです。
adachi>
adachi>
adachi> そこで質問です。
adachi> ユーザへの利便性のため入力された単語の前後にアスタリスク
adachi> を付けて中間一致検索を自動的行うようなことが簡単に出来ない
adachi> ものでしょうか?
adachi>
adachi>
adachi> 環境は、以下の通りです。
adachi> System: solaris
adachi> Namazu: 2.0.5
adachi> Perl: 5.006
adachi> KAKASI: 2.3.2
adachi>
adachi> -----------------------------------------------------------------
adachi> ◆ 足立 嘉浩 (Yoshihiro Adachi) ◆
adachi> ◇ (株)電力計算センター 技術本部 技術企画室 ◇
adachi> ◆ TEL: 03-3295-5751(直通) FAX: 03-3295-5753 ◆
adachi> ◇ E-mail: adachi@xxxxxxxxx URL: http://www.dcc.co.jp/ ◇
adachi> -----------------------------------------------------------------
adachi>
∬ω================================================================ω∬
山本 秀吉 ◆ Mailto: hide@xxxxxxxxxxxxx
松下コンピュターシステム株式会社 サポートセンター
Phone.+81-6-6881-0670 ξ
Fax. +81-6-6881-0630 Pana/Van.7-736-212 ■P (JAVA)
URL: http://www.panasonic.co.jp/mac ―
∬Ω----------------------------------------------------------------Ω∬