Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: pdftotext にて文字化けします。



足立 です。


iwasaki jyunkoさんは
02/03/15付 「[namazu-win32-users-ja] Re:pdftotext にて文字化けします。」で書
きました。
 >
 >DOS上でpdftotextを動作させたときに生成されるファイルの
 >文字化けはなくなったのですが、
 >半角英数字しか書き出されなくなってしまいました…。
 >(試しに、"pdf.pl"の記述の
 > system("$pdfconvpath -q -eucjp -raw $tmpfile tmpfile2");の
 > エンコード部分を削除したりShift‐JISに変更してみましたが、
 > 現状は変りませんでした。)
ここが間違っているような...
芝崎さんがかかれた通り、

-	system("$pdfconvpath -q -eucjp -raw $tmpfile $tmpfile2");
+	system("$pdfconvpath -q -enc EUC-JP -raw $tmpfile $tmpfile2");

です。-は改変前で、+は後 の意味です。
DOS上でうまく出力出来るということから考えると、違うのかもしれないですが...。

----
Hiroshi ADACHI
adachi@xxxxxxxxxxxxxxxxxxxxxx