Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: EUCでフォーム部分の文字化けについて



寺西です。

SASAKI Yoshiaki wrote:
> 
> Tadamasa Teranishi <yw3t-trns@xxxxxxxxxxxxxxx> wrote:
> 
> > namazu を -h オプション付きで実行すると HTML が出力されます
> > ので、これをファイルに保存して、kcc でチェックしてみてください。
> > また、そのファイルを Web ブラウザで開いて文字化けがないか確認して
> > みてください。
> 
> 前後しますが次のように namazu -h でtest.htmlを作成し、Webブラウザ
> で開きました。全く文字化けなどは見当たらず正常に表示されました。

わかりました。では、少なくともインデックスは壊れていないよう
ですね。
 
> # namazu -h テスト投稿です /var/lib/namazu/index/ml-name \
>   > /var/www/html/mhonarc/ml-name/test.html

念のため -f オプションで namazu.cgi で使っている .namazurc を
指定しても大丈夫かどうかご確認ください。(大丈夫だとは思いますが)
  
> (検索実行後の画面でも)
> 「表示」「エンコード」は(自動的に)日本語(EUC)になっています。
> この状態でフォーム部分がこわれたような表示になります。

わかりました。該当部分は NMZ.head* の箇所かと思われますので、
編集した部分がまずいようにも見えます。

「Namazu による全文検索システム」、「インデックスの最終更新日:」
といった NMZ.head.ja 部分の文字列も壊れているのですよね?

それとも、そこは大丈夫で、<input> タグ部分以降が化けている
のでしょうか?
# その違いが重要です。

> 「検索実行後のページの他の部分は文字化けしていませんが」と書いた
> のは一部不正確で、参考ヒット数の行の行末も次のように壊れています。
> 
> 参考ヒット数: { [ 縺: 0 ] [ 薙: 0 ] [ s: 16 ] [ 縺: 0 ] [ ・: 0 ] [ ■: 27 ] [ 縺: 0 ] [ 移 0 ] :: 0 }

なるほど。
これを見ると、入力した文字が化けてそうですね。
 
> ここまで書いて思ったのですが、どうもSubmitした後、namazuの検索エ
> ンジンに届くまでの間に、文字コード関連の問題があるのでしょうか。
> つまりnamazuの話ではなくWebサーバやOS側の設定なのかもしれないと。
> # だとしますとnamazuから離れる話題で恐縮ですが

Webブラウザから Web サーバに送る漢字コードについては、
特に規定がないので、UTF-8 で送られると Namazu では処理
できません。
受け付けられるのは EUC, ShiftJIS, JIS ぐらいです。

ご使用の Web ブラウザの種類とバージョンを教えていただけませんか?

> cgiに関するApacheなどの設定で何か考えられるでしょうか。

あるのかもしれませんが、ちょっと知りません。

とりあえず NKF を 2.0.4 にバージョンアップすると、UTF-8 対応
になりますので、NKF のバージョンアップをしてみてください。
(2.X 系は、2.0.4 未満は問題があるので使用しないでください。)
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E