Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
 Re: pdftotext 文字化けします
- From: Hiroshi ADACHI <adachi@xxxxxxxxxxxxxxxxxxxxxx>
 
- Date: Wed, 24 Jul 2002 08:54:35 +0900
 
- X-ml-name: namazu-win32-users-ja
 
- X-mail-count: 01417
 
- References: <001701c2320b$ad93aa40$2d6710ac@nbs006>
 
足立 です。
初めまして。
西村 哲哉さんは
2002/07/23(Tue)付 「[namazu-win32-users-ja] pdftotext 文字化けします」で書き
ました。
 >初めまして西村と申します。
 >
 >pdftotextコマンドでPDFファイルのテキストデータ(含日本語)を
 >取り出したいのですが、作成されたテキストファイルの
 >中身を見ると、日本語が文字化けしています。
 >半角英数字は取り出せているのですが、日本語が化けています。
 >過去メールなど見て試行錯誤しましたが、どうしてもうまくいきません。
 >その際、関係あると思われる、以下のようなエラーが返ってきます。
 >
 >Error: Couldn't find cidToUnicode file for the 'Adobe-Japan1' collection
 >Error: Unknown character collection 'Adobe-Japan1'
 >Error: Unknown font tag 'G1'
 >Error: Unknown font tag 'G1'
 >Error: Unknown font tag 'G1'
このエラーは見たことないのですが、
 >4. 編集した C:\Program Files\Xpdf\japanese\add-to-xpdfrc を
 >C:\Program Files\Xpdf\xpdfrc.txtの最後に追加。
単なる記入ミスではないかと思うのですが、"xpdfrc" に追記、です。
他に違いは、
 >・xpdf: version 1.01を使用
私がトライしたときは、1.00だった気がします。
両方とも関係ない気がしますねえ。
お力になれなくてすいません。
----
Hiroshi ADACHI
adachi@xxxxxxxxxxxxxxxxxxxxxx