Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: 全角半角変換
私もとりあえず思うところを書いてみます。
At Fri, 06 Jun 2003 17:45:57 +0900,
Yukio USUDA wrote:
> ただ、コード変換はどこが責任をもってするのか?、変換前コード名の
> 特定はどこでするのか?というところを整理したほうがよいと思ってい
> ます。
CVS HEAD では filter 以外の処理(--html-split 相当の個所や非ファイル
対応など)も分離しているのですが、同様に言語に関わる処理も分離すべきで
はないかと思っています。
とはいえ、フィルタがからむと難しいですね...
本当は、内部で処理されるデータに言語情報をもたせ、
* 読み込み処理の範疇で言語/encoding が判明した場合
* filter 処理で判明した場合
それぞれに対応できるようにするのが良いのかな、という気がしています。
前者はたとえば、HTTP で取得したときに得られる charset パラメータが該
当するでしょうし、後者は HTML 内に記述されている meta tag の内容で決定
される場合が一例となるでしょう。
現状は単に binary stream を変数の reference で渡しているだけですが、
そういった構造的なところから手をいれないといけないかなあ、と漠然と考え
ていました。
2.1 でそこまでやるのは無理ですかね...
> といった対応を考えたのですが、APIが変わるのを気にしなければAが
> シンプル。(現在の$$$$$という引数は既に多いような気がしますが)
2.1 に関しては、API の変更はあまり気にしなくても良いかなと思ってはい
います。
--
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx
knok@xxxxxxxxxx / knok@xxxxxxxxxx