Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: pdftotext 文字化けします



足立 です。

初めまして。


西村 哲哉さんは
2002/07/23(Tue)付 「[namazu-win32-users-ja] pdftotext 文字化けします」で書き
ました。
 >初めまして西村と申します。
 >
 >pdftotextコマンドでPDFファイルのテキストデータ(含日本語)を
 >取り出したいのですが、作成されたテキストファイルの
 >中身を見ると、日本語が文字化けしています。
 >半角英数字は取り出せているのですが、日本語が化けています。
 >過去メールなど見て試行錯誤しましたが、どうしてもうまくいきません。
 >その際、関係あると思われる、以下のようなエラーが返ってきます。
 >
 >Error: Couldn't find cidToUnicode file for the 'Adobe-Japan1' collection
 >Error: Unknown character collection 'Adobe-Japan1'
 >Error: Unknown font tag 'G1'
 >Error: Unknown font tag 'G1'
 >Error: Unknown font tag 'G1'
このエラーは見たことないのですが、

 >4. 編集した C:\Program Files\Xpdf\japanese\add-to-xpdfrc を
 >C:\Program Files\Xpdf\xpdfrc.txtの最後に追加。
単なる記入ミスではないかと思うのですが、"xpdfrc" に追記、です。


他に違いは、
 >・xpdf: version 1.01を使用
私がトライしたときは、1.00だった気がします。


両方とも関係ない気がしますねえ。
お力になれなくてすいません。

----
Hiroshi ADACHI
adachi@xxxxxxxxxxxxxxxxxxxxxx