Namazu-win32-users-ja(旧)

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: pdftotext 文字化けします

From: Hiroshi ADACHI <adachi@xxxxxxxxxxxxxxxxxxxxxx>
Date: Wed, 24 Jul 2002 08:54:35 +0900
X-ml-name: namazu-win32-users-ja
X-mail-count: 01417
References: <001701c2320b$ad93aa40$2d6710ac@nbs006>

足立 です。

初めまして。


西村　哲哉さんは
2002/07/23(Tue)付 「[namazu-win32-users-ja] pdftotext 文字化けします」で書き
ました。
 >初めまして西村と申します。
 >
 >pdftotextコマンドでPDFファイルのテキストデータ（含日本語）を
 >取り出したいのですが、作成されたテキストファイルの
 >中身を見ると、日本語が文字化けしています。
 >半角英数字は取り出せているのですが、日本語が化けています。
 >過去メールなど見て試行錯誤しましたが、どうしてもうまくいきません。
 >その際、関係あると思われる、以下のようなエラーが返ってきます。
 >
 >Error: Couldn't find cidToUnicode file for the 'Adobe-Japan1' collection
 >Error: Unknown character collection 'Adobe-Japan1'
 >Error: Unknown font tag 'G1'
 >Error: Unknown font tag 'G1'
 >Error: Unknown font tag 'G1'
このエラーは見たことないのですが、

 >4. 編集した C:\Program Files\Xpdf\japanese\add-to-xpdfrc を
 >C:\Program Files\Xpdf\xpdfrc.txtの最後に追加。
単なる記入ミスではないかと思うのですが、"xpdfrc" に追記、です。


他に違いは、
 >・xpdf: version 1.01を使用
私がトライしたときは、1.00だった気がします。


両方とも関係ない気がしますねえ。
お力になれなくてすいません。

----
Hiroshi ADACHI
adachi@xxxxxxxxxxxxxxxxxxxxxx

Follow-Ups:
- Re: pdftotext 文字化けします
  - From: 西村　哲哉

References:
- pdftotext 文字化けします
  - From: 西村　哲哉

Prev by Date: pdftotext 文字化けします
Next by Date: Re: pdftotext 文字化けします
Previous by thread: pdftotext 文字化けします
Next by thread: Re: pdftotext 文字化けします
Index(es):
- Date
- Thread