Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: filter/macbinary.pl試用結果



佐久間です.


> 寺西です。
> 
> "Sakuma,Hiroaki" wrote:
> > 
> > ついでと言っては何ですが,この正規表現でXHTMLタグも消えるのでしょうか?
> > 例えば,
> > 
> > <br/>
> > や
> > <br />
> > といったタグにはマッチしないと思います.前に気になってバグとして報告した
> > 気が
> > しますが,対応されてないですよね?
> 
> Namazu は XHTML には正式対応していないので...って話ではないかと
> 思います。
> 
> 本件と、XHTML の話は別になってしまうので、XHTMLタグは消えないって
> ことになるでしょうね。
> 
> XHTML については filter/html.pl に拡張するのが良いのか、
> XHTML 用フィルタを用意するのが良いのかですね。
> filter/hdml.pl があるので、別フィルタを用意した方が良いのかも
> しれません。

XHTMLはあくまでHTMLの一種(そしてXMLのアプリケーションの一種)であって,HTMLと
は別の規格ではありません.
分けて考える方が不自然だ思います.
HDMLはHTMLとは無関係の規格です.



> > > 特に大きなメリットがないなら、一発で書かなくても良いのでは?
> > > # perl が好きな方には、ええーって話かもしれないけど。
> > 
> > Perler的には,バラバラで書かれるより,一つの正規表現で書かれていた方が可
> > 読性
> > が高いですが....
> 
> そうかもしれませんが、正規表現が 非Perler にとって Perl の敷居を
> 高くしているのは事実です。
> 非 Perler にとっては可読性が低く、バグをいれてしまう原因にも
> なります。実際、あれこれいろいろ正規表現を考えて、問題点がないか
> をチェックするのは大変です。(今回でも数回練り直しているわけですから)
> 小さな問題に切り分けて解決する方が生産性が高いこともあります。

私はどっちでも構いませんが.ただ,可読性の事を言われたので,それなら正規表現
を書いた方が読みやすいな,と思っただけですので.
# Namazuは処理を分けすぎて読みにくいという日頃の思いもありますし...



=== Sakuma,Hiroaki =======================================================
BEETAS.org          www.beetas.org      sakuma@xxxxxxxxxx
Webmin-JP           jp.webmin.com       sakuma@xxxxxxxxxxxxx
Waseda Univ CS                          sakuma@xxxxxxxxxxxxxxx
=== "There's More Than One Way To Do It" =================================