namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Namazu I18N?



だいぶズレてきたので Subject を変更しました。

Satoru Takabayashi <ccsatoru@xxxxxxxxxxxxxxxxxx> wrote:

> >> あと、内部処理は完全に EUC-JP に依存しているので ISO-8859-1 みたい
> >> な 8 bit のコードが来ると困ったことになります。
> >
> >こっちの方が問題ですね…。私の職場には Jean-Fran&ccedil;ois とか
> >H&aring;kon とか D&uuml;rst とかいった名前の人がゴロゴロいるので、
> >これらが扱えないようだと率直に言って使い物になりません。
> 
> Namazuに限らず困った話です。

今や日本語と英語だけ扱えればいいってわけにもなかなかいかないですからね…。
Latin 1 の右半面くらいは扱えると嬉しいなぁ。

> ># でも、「EUC-JP に」依存しているなら、少なくともウムラウトやアクサン
> ># 付きの文字は code set 3 の JIS X 0212 の文字に変換すれば扱えるんです
> ># よね? ;-p
> 
> またそういう意地悪なことを…。 EUC-JP の code set 0 と 1 しか考え
> ていません。そもそも JIS X 0212 を使える環境が整っていないようです
> (Shift_JISでは無理ですし、 ISO-2022-JPにも含まれない)。

Shift_JIS はともかく、ISO-2022-* なら JP-1 とか JP-2 で JIS X 0212 が
使えますね。Windows 98 のフォントには JIS X 0212 が全部含まれてる
ようだし、環境は整いつつあるのかも。

# とか言ってるうちに JIS X 0213? の方が広まったりして…。

> >> それから、最近はウェブの検索エンジンとして使うことをあまり考えてい
> >> ないのだけど、検索結果を <A NAME="foo"> や ID の単位で出せると便利
> >> かもしれません。やろうと思えばできるけど、やる気が起きない ;-)。
> >
> >XML で出力したりするとちょっとカッコイイかもしれません ;-)
> 
> 出力形式はカスタマイズ可能にすると良さそうですね。
> 
> # Jドキュメント形式とか ;-)

マボロシの J document DTD あげようか? ;-)

# 今どき <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Draft//EN">
# などと書いてると、私のシステム上の nsgmls では J document DTD に
# 従って検証してしまうのでした ;-p

-- 
石川 雅康