Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: parallel mknmz (Re: mknmz next generation)



Bansoukou <bansoukou@xxxxxxxxxxxx> wrote:

>個人的には次のmknmzはCで書いて欲しいと思っている一人です。
>主な理由は、2つあります。
>
>1.移植が容易になる
>Cだけで書かれているコードは結構あちこちのプラットホームに
>移植しやすいですね。現在のようにPerlを前提にしていると、
>結構しんどいです。
>Macに移植を考えた時に困ったのが、標準入出力がないことで、
>こいつを前提にあれこれパイプで処理を行いながら動作する
>スタイルのPerlスクリプトは面倒なのです。

移植性は Perl の方がずっといいと思います。「あれこれパイプで
処理を行う」部分、以外は Mac でも動きますよね?  C言語のプロ
グラムでは、環境ごとの非互換を吸収するために 
autoconf/automake でいろいろとがんばらないといけません。

僕は mknmz を C言語で書き直す利点として次の2つを考えています。

  * 高速化
  * ライブラリ化


>2.パーサをまともに実装できるようになる
>現在のようにPerlの正規表現を利用して文書をパースしていると、
>色々と不具合があると思います。括弧の対応など、正規表現では
>正確にはトレースできないことが知られていたりもしますので、
>実用上はこちらのほうが深刻かもしれません。

Perl にも HTML::Parser や XML::Parser はあります。これらを使
わない理由は次の通りです。

  * 現在のいい加減な処理でも結構うまくいっているから
  * 書き直すのが面倒だから
  * 遅くなるから


>先にCatfishなんとかしないと〜(笑)

期待しています。:-)

-- Satoru Takabayashi