Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 制御コードの削除について



寺西です。

NOKUBI Takatsugu wrote:
> 
> # 指摘をもらったのはその後「ASCII 環境では 0x80-0xff も binary 扱いに
> # して欲しい」という話だったかな。
> 
> >> しかし、野首さんのコードで目的の制御コードを取り除くことができます
> >> ので、安全のためタブ、ESC、改行(CR, LF)を排除しない方針でいきます。
> 
>   もう少し考えてみたのですが、wakatize する前に除去した方が、外部から
> のアヤシゲな data を排除できて良いかもしれません。

最初、そう思ったのですが漢字コードが EUC になっているのかどうか
ちょっと不安だったので、wakatize の後に書いていました。
調べたところ、ここに来る時には既に EUC になっているようですので、
wakatize の前に入れることにします。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E