Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: PDF ファイルをページごとに分割
岡埜です
htmlsplit.pl
$cont =~ s#(<a[^>]*\s+)name=(["'])\2([^>]*>(.*?)</a>)#$1$4#sgi;
↑74行目あたりに分割の前処理としてこの1行を加える
$cont =~ s {
\G(.+?) # 1
(<h([1-6])>)?\s* # 2, 3
<a[^>]*\s+name=([a-zA-Z0-9-\.]+| # 4,
(["']).+?\5)[^>]*>(.*?)</a> # 5,6
\s*(</h\3>)? # 7
} {
write_partial_file($1, $4, $6, $id++, $mtime, \%info)
}sgexi;
あと
write_partial_file() で
my $prev_anchored = $info_ref->{'anchored'};
$prev_name =~ s#\n\r##sg;
$prev_name =~ s#\n##sg;
↑この2行を加えてuriに改行が紛れ込むのを防ぐ