Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: EUCでフォーム部分の文字化けについて
- From: Tadamasa Teranishi <yw3t-trns@xxxxxxxxxxxxxxx>
- Date: Wed, 21 Jan 2004 23:21:00 +0900
- X-ml-name: namazu-users-ja
- X-mail-count: 03716
- References: <20040121204817.8EE9.NQC38290@nifty.com>
寺西です。
SASAKI Yoshiaki wrote:
>
> 早速ですが、namazu.cgiによる検索の際に、検索式として日本語を入力
> して行うと検索できません。ASCII文字の場合は検索できています。
> また、シェル上でのnamazuコマンドでの検索もできています。
作成したインデックスを使って、
namazu コマンドで日本語の検索および表示はできているということ
ですね?
であれば、インデックスには問題がないということになり、namazu.cgi
の設定の問題ということでしょう。
> 日本語を入力して行った場合、フォームのテキストフィールドに化けた
> 文字が表示され、実行(submit)ボタンも消えてしまいます。例えば、
この時、IE をお使いなら「表示」「エンコード」が日本語(EUC)に
なっているか確認してください。
もし、なっていないなら、日本語(EUC)を選択すると、表示だけは
正しくなりませんか?
> このページをWindowsのメモ帳で見ると該当部分は
> <input type="text" name="query" size="40" value="裔ニ蚶裔ve「」裔ツ">
> <input type="submit" value="Search!">
> のようになっています。(valueの中のニ、「、」、ツは実際は半角です)
EUC コードのはずですので、メモ帳では文字化けするが当然です。
そういう意味では正しく EUC コードになっているのではないかと
思えます。(この化けた文字が EUC として正しいかどうかまでは確認
していませんけど。)
> 検索実行後のページの他の部分は文字化けしていませんが、検索に失敗
> しているため
> 検索式にマッチする文書はありませんでした。
> というメッセージが表示されます。
>
> mknmzで作成したNMZ.head.jaは、<head></head>の間に
> <Meta HTTP-EQUIV="content-type"
> CONTENT="text/html;charset=EUC-JP">
> を加えた以外にカスタマイズはしていません。
ここが気になります。
このカスタマイズした際に漢字コードを EUC-JP で保存しましたか?
別の漢字コードで保存したりしていませんか?
# kcc でチェックしているのなら、問題ないのかもしれませんが。
ここが一番怪しそうに見えます。(kcc が誤認する可能性もあるで
しょうし。)
> 尚、保存している(検索対象の)htmlは、mhonarcでいったんJISで出力
> し、nkf -meでEUCに変換したものです。
> (本当は一度にEUCにしたかったのですがメール本文行頭に ESC+(B が
> 入ってしまうため、まずは強引にこのように作成しました。)
結構特殊な手順を踏んでおられますが、これ自体が問題になって
いることはないでしょう。namazu コマンドで検索できているなら。
> kcc というコマンドがあることを知りましたので、念のため上記htmlや
> NMZ.head.ja などは kcc -c でEUCと判定されることは確認しています。
namazu を -h オプション付きで実行すると HTML が出力されます
ので、これをファイルに保存して、kcc でチェックしてみてください。
また、そのファイルを Web ブラウザで開いて文字化けがないか確認して
みてください。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E