Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: 全角記号から半角記号へ Re: filename検索他修正
寺西です。
Yukio USUDA wrote:
>
> Tadamasa Teranishi wrote:
>
> > 全角記号を半角記号に変換する処理を NKF から変換テーブルをいただき、
> > 組み込んでみました。(スペースの処理も統合)
> >
> このテーブルだとASCIIにない記号は全部消滅します。
ん? それはたとえばどんな記号でしょう。
消滅せずにそのまま残ると思いますが。
むしろ、記号は別件で消したいので消えるならそっちに使いたいですが。
(--no-symbole の方で)
> codeconv::toeucではこれらは変換していませんし、
toeuc では -emXZ1 なので変換するはずです。
# ゆえに動作をあわせるために導入しようとしているのですが...。
> 記号を元に検索したいというニーズがメーリングリストで
> 出ていたこともあったかと思います。
このあたりは NKF と決別する時にでもまとめてやらないと、どうにもなら
ないような気がします。
> 対応のしやすさも考えれば
> 全角記号を半角記号にする処理は
> 別ルーチンにしておいた方が良いと思います。
スペースの変換と分ける必要はないと思いますよ。NKF で分かれている
のは、-Z1 と -Z2 でスペースの個数を変えたいからですから。
もっとも、変換テーブル自体は NKF にあわせているので、これになって
いますが、NKF と決別したら見直すのはありでしょう。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E