namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
初めまして&全角中グロについて質問です
- From: Masakazu Hanawa <hanawa@xxxxxxxxx>
- Date: Thu, 26 Nov 1998 19:45:53 +0900
- X-ml-name: namazu
- X-mail-count: 01670
初めまして、塙と申します。よろしくお願いいたします。
早速で申し訳ありませんが、"・"(全角の中グロというのかな?)の扱いについ
て質問です。
日本語全文検索システムを構築するため、Webサーバ上にNamazuをインストールし
ました。なんとかうまくいったようで、Webブラウザを使ってCGI経由での検索が
できるようになりました。
環境は以下の通りです
●Webサーバ
Solaris2.5.1(SPARC) + Apache1.2.6
検索対象となるHTMLファイルは漢字コーはS-JIS、改行コードLFで保存
Namazu v1.2.0.8 + kakasi 2.2.5 + nkf-1.62をインストール
●クライアントPC
WindowsNT4.0 + Netscape Communicator4.05(cgi-bin/namazu.cgiで検索)
で、いろいろ検索を試しところ、検索語に例えば"ビル・ゲイツ"と入れて検索す
ると、以下のような結果が出ます。(もちろん検索対象のHTMLファイルに"ビル・
ゲイツ"はあります。)
----------------------------------------------------------------------
検索結果
参考ヒット数: { [ ビル: 210 ] [ ・: 0 ] [ ゲイツ: 118 ] :: 0 }
検索式にマッチする項目はありませんでした。
----------------------------------------------------------------------
全角の中グロにマッチしないため、「マッチする項目が無い」と出ています。
他のサイトも調べてみましたのですが、それぞれ違った結果になりました。
●Namazu mailing list archives(Namazu v1.3.0.0)
(http://avocado.aichi-u.ac.jp/%7Ealias/namazu/)
参考ヒット数: { [ ビル: 8 ] [ ・: 0 ] [ ゲイツ: 0 ] :: 0 }
→中グロはヒットしない
●パシフィック・ハイテック(Namazu v1.2.0.1)
(http://www.pht.co.jp/cgi-bin/namazu.cgi)
参考ヒット数:
tlj-general-ml: { [ ビル: 1 ] [ ・: 258 ] [ ゲイツ: 0 ] :: 0 }
→中グロはヒットする
●日経インターネットテクノロジー(Namazu v1.1.2.2)
( http://nit.nikkeibp.co.jp/cgi-bin/namazu.cgi)
参考ヒット数: [ ビル: 9 ] [ .: 1158 ] [ ゲイツ: 0 ]
→中グロは半角ピリオドに変換されてヒットする
できれば中グロをヒットさせるようにしたいのですが、これは設定可能でしょう
か? ドキュメントを読んでもよく分からなかったので、申し訳ありませんがよ
ろしくお願いいたします。
-----------------------------------------------------------------------
塙 理和 Masakazu Hanawa 株式会社IDGコミュニケーションズ
hanawa@xxxxxxxxx 〒102 東京都千代田区富士見1-2-27
TEL 03-3222-6584 FAX 03-3222-5068