Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: parallel mknmz (Re: mknmz next generation)
- From: Bansoukou <bansoukou@xxxxxxxxxxxx>
- Date: Tue, 28 Mar 2000 14:15:13 +0900
- X-ml-name: namazu-devel-ja
- X-mail-count: 00278
- References: <200002200517.OAA19208@ring.etl.go.jp> <20000328103445M.satoru-t@is.aist-nara.ac.jp>
Bansoukouです。
On Tue, 28 Mar 2000 10:34:45 +0900
Satoru Takabayashi <satoru-t@xxxxxxxxxxxxxxxxxx> wrote:
> 備忘録です。 (すぐに実装できるわけではありません)
>
> Satoru Takabayashi <satoru-t@xxxxxxxxxxxxxxxxxx> wrote:
>
> >もちろん、すべてを Cで書くという方針でもいいです。どうせ C
> >で書くなら、文書を 1つづつ読み込んで処理する部分を multi
> >threading にするといいと思います。この処理は並列化できるはず
> >なので、multi processor の計算機ではぐっと速くなるでしょう。
個人的には次のmknmzはCで書いて欲しいと思っている一人です。
主な理由は、2つあります。
1.移植が容易になる
Cだけで書かれているコードは結構あちこちのプラットホームに
移植しやすいですね。現在のようにPerlを前提にしていると、
結構しんどいです。
Macに移植を考えた時に困ったのが、標準入出力がないことで、
こいつを前提にあれこれパイプで処理を行いながら動作する
スタイルのPerlスクリプトは面倒なのです。
2.パーサをまともに実装できるようになる
現在のようにPerlの正規表現を利用して文書をパースしていると、
色々と不具合があると思います。括弧の対応など、正規表現では
正確にはトレースできないことが知られていたりもしますので、
実用上はこちらのほうが深刻かもしれません。
あと、細かいことも言い出すと色々有るんですが...
先にCatfishなんとかしないと〜(笑)
---------------------------
Bansoukou
Email: bansoukou@xxxxxxxxxxxx