Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: 全角記号から半角記号へ Re: filename検索他修正



寺西です。

Yukio USUDA wrote:
> 
> Tadamasa Teranishi wrote:
> 
> > 全角記号を半角記号に変換する処理を NKF から変換テーブルをいただき、
> > 組み込んでみました。(スペースの処理も統合)
> >
> このテーブルだとASCIIにない記号は全部消滅します。

ん? それはたとえばどんな記号でしょう。
消滅せずにそのまま残ると思いますが。

むしろ、記号は別件で消したいので消えるならそっちに使いたいですが。
(--no-symbole の方で)

> codeconv::toeucではこれらは変換していませんし、

toeuc では -emXZ1 なので変換するはずです。
# ゆえに動作をあわせるために導入しようとしているのですが...。

> 記号を元に検索したいというニーズがメーリングリストで
> 出ていたこともあったかと思います。

このあたりは NKF と決別する時にでもまとめてやらないと、どうにもなら
ないような気がします。

> 対応のしやすさも考えれば
> 全角記号を半角記号にする処理は
> 別ルーチンにしておいた方が良いと思います。

スペースの変換と分ける必要はないと思いますよ。NKF で分かれている
のは、-Z1 と -Z2 でスペースの個数を変えたいからですから。

もっとも、変換テーブル自体は NKF にあわせているので、これになって
いますが、NKF と決別したら見直すのはありでしょう。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E