Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: pdftotext 文字化けします
- From: Hiroshi ADACHI <adachi@xxxxxxxxxxxxxxxxxxxxxx>
- Date: Wed, 24 Jul 2002 08:54:35 +0900
- X-ml-name: namazu-win32-users-ja
- X-mail-count: 01417
- References: <001701c2320b$ad93aa40$2d6710ac@nbs006>
足立 です。
初めまして。
西村 哲哉さんは
2002/07/23(Tue)付 「[namazu-win32-users-ja] pdftotext 文字化けします」で書き
ました。
>初めまして西村と申します。
>
>pdftotextコマンドでPDFファイルのテキストデータ(含日本語)を
>取り出したいのですが、作成されたテキストファイルの
>中身を見ると、日本語が文字化けしています。
>半角英数字は取り出せているのですが、日本語が化けています。
>過去メールなど見て試行錯誤しましたが、どうしてもうまくいきません。
>その際、関係あると思われる、以下のようなエラーが返ってきます。
>
>Error: Couldn't find cidToUnicode file for the 'Adobe-Japan1' collection
>Error: Unknown character collection 'Adobe-Japan1'
>Error: Unknown font tag 'G1'
>Error: Unknown font tag 'G1'
>Error: Unknown font tag 'G1'
このエラーは見たことないのですが、
>4. 編集した C:\Program Files\Xpdf\japanese\add-to-xpdfrc を
>C:\Program Files\Xpdf\xpdfrc.txtの最後に追加。
単なる記入ミスではないかと思うのですが、"xpdfrc" に追記、です。
他に違いは、
>・xpdf: version 1.01を使用
私がトライしたときは、1.00だった気がします。
両方とも関係ない気がしますねえ。
お力になれなくてすいません。
----
Hiroshi ADACHI
adachi@xxxxxxxxxxxxxxxxxxxxxx