namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

半角カナとSIを含む文書でインデックスがおかしくなる?



伊藤@Bitsです。namazu-2.0 おめでとうございます。

さっそく手元のメールのインデックスを作り直しましたが、検索にひっか
かる筈のメールがひっからなくなりました。logを見てみるとどうも
subject:に半角カナが含まれたメールがありそれ以降 nkf の出力モード
が変ってしまったようです。(半角英数を SSO xx にする)

# RedHat6.1英語版+あやしい日本語localeシステムで使っているので自信
# がないのですが。

他のシステムではいかがでしょうか。

■ 再現手順

$ mkdir tmp
$ cd tmp
$ tar -zxf ../msgs.tar.gz
$ mknmz -a -Uh --verbose --debug . > ../foo.log 2>&1

■ namazu -C の出力
読み込んだ設定ファイル: /etc/namazu/mknmzrc
システム: linux
Namazu: 2.0
Perl: 5.00503
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
ChaSen: no -j -F '%m '
わかち書き: module_kakasi -ieuc -oeuc -w
言語: ja_JP
文字コード: euc
CONFDIR: /etc/namazu
LIBDIR: /usr/share/namazu/pl
FILTERDIR: /usr/share/namazu/filter
TEMPLATEDIR: /usr/share/namazu/template
対応メディアタイプ: 
  application/x-bzip2
  application/x-compress
  application/x-gzip
  message/news
  message/rfc822
  text/hnf
  text/html
  text/html; x-type=mhonarc
  text/plain
  text/plain; x-type=rfc
  text/x-roff

■ 添付

msgs.tar.gz 対象文書
foo.log.gz  デバッグ出力

-- 
(株)ビッツ マイコン開発部ファーム課
伊藤 剛 titou@xxxxxxxxxx

Attachment: msgs.tar.gz
Description: text for index

Attachment: foo.log.gz
Description: mknmz --debug output