Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: pdftotext にて文字化けします。
足立 です。
iwasaki jyunkoさんは
02/03/15付 「[namazu-win32-users-ja] Re:pdftotext にて文字化けします。」で書
きました。
>
>DOS上でpdftotextを動作させたときに生成されるファイルの
>文字化けはなくなったのですが、
>半角英数字しか書き出されなくなってしまいました…。
>(試しに、"pdf.pl"の記述の
> system("$pdfconvpath -q -eucjp -raw $tmpfile tmpfile2");の
> エンコード部分を削除したりShift‐JISに変更してみましたが、
> 現状は変りませんでした。)
ここが間違っているような...
芝崎さんがかかれた通り、
- system("$pdfconvpath -q -eucjp -raw $tmpfile $tmpfile2");
+ system("$pdfconvpath -q -enc EUC-JP -raw $tmpfile $tmpfile2");
です。-は改変前で、+は後 の意味です。
DOS上でうまく出力出来るということから考えると、違うのかもしれないですが...。
----
Hiroshi ADACHI
adachi@xxxxxxxxxxxxxxxxxxxxxx