Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: 定形部分を外す方法
冨樫@GTGSです。
>>> On Tue, 05 Feb 2002 17:29:05 +0900, 藤原 誠 / Makoto Fujiwara <makoto@xxxxx> said:
> 遅いとか、メモリの使用量の問題などで、これを C でもし書き
> 直すとすると、そういうようなちょっとした変更の可能性が捨てら
> れてしまってはこまるな、
> でも Perl 路線をを維持すると、そういう「美しい」方向に行く
> と、ますます遅くなってしまうし
おっしゃることわかります。id 属性・class 属性は、body 要素内のほとんど
の子要素に指定できます。それらをすべてなめていったらとんでもないことに
なります。Perl には荷の重い仕事かもしれません。
ただし、(i) 任意の部分を検索対象からはずしたい (ii) 要約表示をコントロー
ルしたいという二つの目的を達成するためだけなら、例えば 処理対象の要素
を div と span に限定、属性は class のみを使うというようにすれば資源を
少し節約できると思います。
<body>
<div class="header">ヘッダなど</div>
...
<div class="summary">サマリ</div>
...
<div class="footer author address">フッタなど</div>
</body>
藤原さんのコメントコントロール案と形式はほぼ同じです。
どちらにせよ仕様の議論がまだまだ必要ですね。改造のスケジュールは 2.1
になってからのようです。
なお id 属性は name 属性と同様に --html-split の対象にして欲しいと思っ
ています。
--nobu