Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: .mhonarc.mrc の日本語ボタン (Re:MHonArc 2.6.3...)
寺西です。
# MHonArc ネタで申し訳ないです。
藤原 誠 / Makoto Fujiwara wrote:
>
> 寺> JIS で書けない根拠は何でしょう。普通なら書けると思いますが、何か
> 寺> 問題がありますか?
>
> .mhonarc.mrc は 当然プログラムから読みますが、そういう時、もし
> euc 等に変換しないと、日本語か英語(ascii)かの判別論理が面倒です
> よね。
namazu が内部の漢字コードを EUC としている理由のひとつ(それ以外は
知らないけど。)は、そうです。
しかし、MHonArc では Namazu と違って .mhonarc.mrc の日本語と英語を
判別する必要が基本的にありません。タグを用いて切り出しができるので、
ユーザが自由に定義できる(日本語を含む)文字列の場所は、限定されます。
また、その文字列はほとんど解析する必要がなく、そのまま HTML に
出力すれば良いわけです。
ただ1点の問題は、出力すべき文字列に '$xxx$' が含まれていると、それは
変数だとみなして、文字列の置き換えを行うことです。
JIS の場合、'$' が含まれますので、ここで問題は生じますが、
namazu-devel-jp#02920 に書いた 2 つの方法で回避できるようです。
なお、rcfile に記述した漢字コードは変換されずに HTML に出力されるため、
出力する HTML の漢字コードに合わせて rcfile を書かなければ、複数の
漢字コードが混在する HTML になってしまいます。
numeric character reference で出力させるのなら、numeric character
reference で書くということです。
# となると、HTML に出力する前にコード変換ルーチンを通した方が良い
# のかもしれません。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E