namazu-ml(ring)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
 Re: About pdf2txt
- From: Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx>
 
- Date: Thu, 8 Apr 1999 12:23:30 +0900 (JST)
 
古川です。
>> On Wed, 7 Apr 1999 11:46:53 +0900 (JST), Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx> said:
  > 新しい pdf2txt だと、今までダメだったものが読めるようになりますでしょう
  > か?なっていれば、私のは用無しで、メデタシメデタシなんですが。
  > # ↑件の記事を見ても、私には用語がさっぱり分からなかったものですから、
  > # こんな漠然とした質問になってしまいました。すみません。
  > 私も試してみようと思いますが、ちょっと事情があって、明日以降になってし
  > まいます。
pdf2txt_0.61 を試してみました。結果を報告します。
(1) 日本語部分の変換は、できている!!
(2) 0.43 では error になっていた、FlateDecode 文書も、ちゃんと変換され
    ている。
(3) が、大量のゴミも出力されている。
    また、'-o' オプションも廃止されている。
(4) CMap がメモリを喰う
        % limit
        cputime         unlimited
        filesize        unlimited
        datasize        22528 kbytes
        stacksize       8192 kbytes
        coredumpsize    unlimited
        memoryuse       30720 kbytes
        descriptors     64 
        memorylocked    10240 kbytes
        maxproc         64 
    では、CMap.pl が load できなかった。(datasize を増やしてやる必要が
    あった)
(5) 美しいスクリプトである。
(6) MacBinary(?) は未対応
  >> # せっかくなので、石田さんに連絡を取って本体に取り込んでもら
  >> # いませんか?
とりあえず、変換自体はできているので、私の汚ならしいパッチの出番は無さ
そうです。
(3)(4) があるので、0.43 + パッチも、実用上無価値とまでは言えないとは思
いますが、まあ、私個人の使用に留めておこうと思います。
-- 
                                        ヤマハ(株)ピアノプレーヤ設計課
                                                              古川 令
                                             furukawa@xxxxxxxxxxxxxxxx