Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Namazu 2.0.6rc2 for Win32 Test Release



古川です。

From: "Yoshinori TAKESAKO" <yoshinori-takesako@xxxxxxxxx>
Subject: [namazu-devel-ja] Re: Namazu 2.0.6rc2 for Win32 Test Release
Date: Sat, 14 Jul 2001 19:22:30 +0900

yoshinori-takesako> あと、以下のスレッドの話のその後はどうなりましたでしょうか?
yoshinori-takesako> ・[namazu-users-ja] Re: mknmz のメタタグの扱い
yoshinori-takesako>   http://www.namazu.org/ml/namazu-users-ja/msg01311.html

よく考えてみると、結構根の深い話ですね。

たとえ nkf に手を入れて -Z3 オプションを作ったとしても、現状
ではまずい点があります。というのも、現在の処理では、euc への
変換をしているのは、toeuc というサブルーチンで、これは mknmz
で呼ばれていて、html 以外の文書にも効いてしまいます。

ちゃんとやろうとすると、euc への変換はフィルタ側に移すか、フ
ィルタモジュールから nkf のオプションを指定できるようにしない
といけなくなります。


で、-Z3 についてですが、

(1) nkf -Z1 の後では、"&" が "&" だったのか "& だったのかを
知ることはできない。

(2) よって、"&" -> "&amp;" の処理は、nkf -Z1 オプションを通
る前に行なう必要がある。

(3) でもその前に euc への変換はやっておきたい。

(4) となると、処理をやるのは、「euc への変換の後、-Z1 の前」
がベスト。

(5) -Z3 を使わないで普通にやると、
        [1] nkf -e で euc に変換
        [2] 文書をさらって "<>”&" を探して変換
        [3] nkf -Z1 を通す

で、私としては、(あるかどうかも分からない) "<>”&" を探す
ために、こんなに処理が増えるのは抵抗がある、nkf でやるのが、
最も簡単かつ効率的、と考えています。


yoshinori-takesako> # 個人的には、バグ修正だけでも変更の加わった NKF-1.93 が
yoshinori-takesako> # リリースされていると嬉しかったりします。(^^

河野さんに、patch と、「バグ修正だけでもしたほうが」というメ
ールを出して、河野さんから「了解」との返事をいただいたのが去
年の 12 月。ですが、現在まで修正版は出ていないようです。こう
いうのって、催促するのも何か違う気がして…


-- 
Rei FURUKAWA 
furukawa@xxxxxxxxxxxx