namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: About pdf2txt



古川です。

>> On Wed, 7 Apr 1999 11:46:53 +0900 (JST), Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx> said:
  > 新しい pdf2txt だと、今までダメだったものが読めるようになりますでしょう
  > か?なっていれば、私のは用無しで、メデタシメデタシなんですが。

  > # ↑件の記事を見ても、私には用語がさっぱり分からなかったものですから、
  > # こんな漠然とした質問になってしまいました。すみません。

  > 私も試してみようと思いますが、ちょっと事情があって、明日以降になってし
  > まいます。

pdf2txt_0.61 を試してみました。結果を報告します。

(1) 日本語部分の変換は、できている!!

(2) 0.43 では error になっていた、FlateDecode 文書も、ちゃんと変換され
    ている。

(3) が、大量のゴミも出力されている。
    また、'-o' オプションも廃止されている。

(4) CMap がメモリを喰う
        % limit
        cputime         unlimited
        filesize        unlimited
        datasize        22528 kbytes
        stacksize       8192 kbytes
        coredumpsize    unlimited
        memoryuse       30720 kbytes
        descriptors     64 
        memorylocked    10240 kbytes
        maxproc         64 

    では、CMap.pl が load できなかった。(datasize を増やしてやる必要が
    あった)

(5) 美しいスクリプトである。

(6) MacBinary(?) は未対応


  >> # せっかくなので、石田さんに連絡を取って本体に取り込んでもら
  >> # いませんか?

とりあえず、変換自体はできているので、私の汚ならしいパッチの出番は無さ
そうです。

(3)(4) があるので、0.43 + パッチも、実用上無価値とまでは言えないとは思
いますが、まあ、私個人の使用に留めておこうと思います。

-- 

                                        ヤマハ(株)ピアノプレーヤ設計課
                                                              古川 令
                                             furukawa@xxxxxxxxxxxxxxxx