namazu-ml(ring)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: About pdf2txt
- From: Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx>
- Date: Thu, 8 Apr 1999 12:23:30 +0900 (JST)
古川です。
>> On Wed, 7 Apr 1999 11:46:53 +0900 (JST), Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx> said:
> 新しい pdf2txt だと、今までダメだったものが読めるようになりますでしょう
> か?なっていれば、私のは用無しで、メデタシメデタシなんですが。
> # ↑件の記事を見ても、私には用語がさっぱり分からなかったものですから、
> # こんな漠然とした質問になってしまいました。すみません。
> 私も試してみようと思いますが、ちょっと事情があって、明日以降になってし
> まいます。
pdf2txt_0.61 を試してみました。結果を報告します。
(1) 日本語部分の変換は、できている!!
(2) 0.43 では error になっていた、FlateDecode 文書も、ちゃんと変換され
ている。
(3) が、大量のゴミも出力されている。
また、'-o' オプションも廃止されている。
(4) CMap がメモリを喰う
% limit
cputime unlimited
filesize unlimited
datasize 22528 kbytes
stacksize 8192 kbytes
coredumpsize unlimited
memoryuse 30720 kbytes
descriptors 64
memorylocked 10240 kbytes
maxproc 64
では、CMap.pl が load できなかった。(datasize を増やしてやる必要が
あった)
(5) 美しいスクリプトである。
(6) MacBinary(?) は未対応
>> # せっかくなので、石田さんに連絡を取って本体に取り込んでもら
>> # いませんか?
とりあえず、変換自体はできているので、私の汚ならしいパッチの出番は無さ
そうです。
(3)(4) があるので、0.43 + パッチも、実用上無価値とまでは言えないとは思
いますが、まあ、私個人の使用に留めておこうと思います。
--
ヤマハ(株)ピアノプレーヤ設計課
古川 令
furukawa@xxxxxxxxxxxxxxxx