Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: PDF ファイルの Indexing エラーについて
小野泰史@リバー です。
白井さん、有り難うございました。
>
># まず、一般的な話として、mknmz のとき、外部コマンドを使う
># filter を用いて Index を作るものについては、まず、その外部コマ
># ンドがちゃんと動くかどうか調べないと何が悪いのかなんとも言えま
># せんです。
>
その通りです。ハイ (^_^;)
>その pdf file を pdftotext.exe で変換してどうなるか(ちゃんと
>text に変換できるかどうか)を確かめてください。
>
># pdftotext で text にならないことには Index も出来ません。
>
>ちなみに、mknmz をするときは、(filter/pdf.pl を参照して下さい)
>
>% pdftotext -q -eucjp in-file out-file
>
>で動かしています。これで、なにかしらのエラーになるのなら、mknmz
>ではどうしようもありません。
>(-eucjp を外したら動いたという方もいらっしゃいました)
>
早速やってみました。
問題のファイルでは...
Error: PDF file is encrypted and cannot be displayed
Error: * Decryption support is currently not included in xpdf
Error: * due to legal restrictions: the U.S.A. still has bogus
Error: * export controls on cryptography software.
Error: Couldn't read xref table
と、エラーメッセージがでてテキスト変換できませんでした。
やはり、暗号化されていることが原因のようです。
#でも、同じようにセキュリティロック掛けられているファイルでもうまく行くこと
もあるのです。不思議ですね。
と言うことで、今回は諦めるしかないですね。
#PDFのIndexingですけれど、7000ファイルほどやって200ほどエラーが出ました。
#殆どが暗号化ファイルの読みとり失敗でした。
#暗号化されてないファイルは、100%うまく行きました。
ではでは。
=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
小野泰史@RIVER
Yasushi Ono [ E-Mail : yasushi@xxxxxxxxxxxxxx ]
RIVER ELETEC CORPORATION
1st. Research & Development Division Section 2
=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=