Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 検索結果の文字化け



平田です。
野首さん、回答ありがとうございました。

NOKUBI Takatsugu wrote:

>   まず一般的なことを言うと、Namazu は日本語 EUC, SJIS, ISO-2022-JP と
> 異なる encoding のインデックス対象データを同時に問題なく扱えます。もち
> ろん、正しい使い方をしている場合に限りますが。

そうでしたか..

>   で、平田さんが直面している問題についてですが、もう少し状況を特定しな
> いと原因は見えてこないので、インデックスを作成した時と同じ環境で mknmz
> -C を実行し、その結果を ML に投稿してもらえると、もう少しなんらかの助
> 言ができるかもしれません。

早速、mknmz -Cを実行したところ、次のような結果になりました。
--
System: linux
Namazu: 2.0.5
Perl: 5.00503
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
ChaSen: no -j -F '%m '
Wakati: module_kakasi -ieuc -oeuc -w
Lang: ja_JP.ujis
Coding System: euc
CONFDIR: /usr/local/etc/namazu
LIBDIR: /usr/local/share/namazu/pl
FILTERDIR: /usr/local/share/namazu/filter
TEMPLATEDIR: /usr/local/share/namazu/template
Supported media types:
  application/x-bzip2
  application/x-compress
  application/x-gzip
  message/news
  message/rfc822
  text/hnf
  text/html
  text/html; x-type=mhonarc
  text/plain
  text/plain; x-type=rfc
  text/x-roff
--

ところでこの環境でインデックスを作成するときに出力されるメッセージなので
すが、Writing index files... と英語でメッセージが表示されます。
これはnamazuサイト上にあった環境変数LANGの設定誤りにあたるようですが。

>   あとは、化け方についての具体的な説明もして欲しいところです。

化け方としてはその規則性をまだつかめていません。sjisコードのメールだけを
検索するようにすると文字化けが起こらなかったり、eucコードとsjisコードが
混在するように検索すると文字化けをしたり(必ず文字化けするわけでばな
い)、検索キーを追加して再検索をすると文字化けを起こしたり、検索結果ペー
ジのフォントがとても大きくなって文字化けしたり、と言う具合です。

問題の原因を切り離して考えたいのですが、どうしたらよいでしょうか。

--
平田由佳
hirata@xxxxxxxxxxxxxx