Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: pdftotext で変換できません。
大野@104.com です。早速のレスをありがとうございます。
やはりpdftotext の問題でしょうか?
先のメールで報告が足りませんでしたが、下記のようなエラーは
確認していました。
# pdftotext -eucjp /home/mo/public_html/pdf/lll.pdf outfile
pdftotext version 0.80 (decryption)
Copyright 1996-1998 Derek B. Noonburg
Decryption (originally) by Leo J.B. Smiers
Usage: pdftotext [options] <PDF-file> [<text-file>]
-f <int> : first page to convert
-l <int> : last page to convert
-ascii7 : convert to 7-bit ASCII (default is 8-bit ISO Latin-1)
-h : print usage information
-help : print usage information
# pdftotext -eucjp /home/mo/public_html/pdf/lll.pdf -
Error: Couldn't open file '-eucjp'
# pdftotext /home/mo/public_html/pdf/lll.pdf -
Segmentation fault
となってしまいます。
再度確認中に気が付きましたが、ローカルマシン上だと
pdftotext、 xpdf ともにversionが0.80(上記エラー参照)
になっていますが、リモートからtelnetでlogin後に確認したら、
両方とも0.90でした。こんなことがあるのでしょうか?
つい先日ダウンロードしたばかりの xpdf-0.90.tgz で
0.80 をインストールした覚えは???ないはずなんですが。
少しパニックっていますが、pdfファイルindexにして検索
かけられるようにするには、諸先輩方が残してくれたlogの
とうりの環境(VersionDown)にて対応するしかないのでしょうか?
もう少し研究してみるつもりです。
ほかにも参考になるご意見がありましたらよろしくお願いします。
こちらから、参考になるデータを出せなくてもうしわけありません。
---
Makoto Ohno
mo@xxxxxxx
>
> たとえばご自身の環境で
> $ pdftotxt /home/mt/public_html/pdf/001.pdf outfile
> として、テキストデータが書出されますでしょうか?
>
> ためしに手元の計算機で、プロテクトされたPDFファイルに対しxpdf-0.90-fefe-diff2
> パッチをあてたpdftotextを用いてテストしてみましたが
>
> % pdftotext -eucjp ./test.pdf outfile
> Error: Copying of text from this document is not allowed.
>
> となり、書出し出来ませんでした。
>
>
> ----
> HIROSE Yoshihide
> yoshihide@xxxxxxxxxx