Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

ChaSen を使うと title タグ内が無視されてしまう



山田と申します。

私の環境ではmknmz時にChaSenをわかち書きに使った場合、html文書中の
<title></title>で囲まれている部分が、そっくりそのままインデックス
に反映されません。KAKASIを使うとスコアも正しく表示され、正常にイン
デックスが作られるので、ChaSenかText-ChaSenのinstallに失敗している
だけの様な気がするのですが、どこが悪いのかちょっと検討がつきません。
ご教授のほどよろしくお願いいたします。

わかち書きにChaSenを使った場合の具体的症状
 ・タイトルと本文中に含まれているキーワードで検索しても、スコアの
  値は本文中のキーワード分しか示さない。
 ・タイトル中にだけそのキーワードが存在する文章はヒットしない。
 ・要約は正常に作られている。

インストールした時の手順が下記URLに覚え書きしてあります。
  http://www.junlab.com/namazu.html

環境
 システム: freebsd
 Namazu: 2.0.7
 Perl: 5.00503
 NKF: /usr/local/bin/nkf
 KAKASI: /home/foo/bin/kakasi -ieuc -oeuc -w
 茶筌: /home/foo/bin/chasen -j -F '%m '
 わかち書き: /home/junlab-admin/bin/kakasi -ieuc -oeuc -w
 メッセージの言語: ja_JP.EUC
 言語: ja_JP.EUC
 文字コード: euc
 CONFDIR: /home/foo/etc/namazu
 LIBDIR: /home/foo/share/namazu/pl
 FILTERDIR: /home/foo/share/namazu/filter
 TEMPLATEDIR: /home/foo/share/namazu/template
 対応メディアタイプ:
   application/x-compress
   application/x-gzip
   message/news
   message/rfc822
   text/hnf
   text/html
   text/html; x-type=mhonarc
   text/plain
   text/plain; x-type=rfc
   text/x-hdml
   text/x-roff

# 今はKAKASIでインデックスを作り直して使っています。


~~~~ Jun Yamada ~~~~~~~~~~~~~~~~
  E-mail hamu69@xxxxxxxxxx
  URL http://www.junlab.com/
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~