Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re:pdftotext にて文字化けします。



おはようございます。
岩崎です。

宮沢様、ご回答どうもありがとうございます。
私の知識不足にお手数をおかけし
大変申し訳ございません。
しかし勉強にもなり、本当に本当にどうもありがとうございます。

しかし、現状はまだ動いておりません。
xpdf-japanese.tar.gzを回答し、教えていただきましたサイトを
参考に変更してみたのですが…。

DOS上でpdftotextを動作させたときに生成されるファイルの
文字化けはなくなったのですが、
半角英数字しか書き出されなくなってしまいました…。
(試しに、"pdf.pl"の記述の
 system("$pdfconvpath -q -eucjp -raw $tmpfile tmpfile2");の
 エンコード部分を削除したりShift‐JISに変更してみましたが、
 現状は変りませんでした。)
Web上で動作させた場合は、以前と同様に検索結果は文字化けしております。

PDFのバージョンによっても検索可能なものとそうでないものがあるのでしょうか?
ちなみに、textファイルををDistiller4.0およびWriterでPDFファイルに書き出したものや
同じくDistiller5.0で書き出したもので試しましたが、現状は変りませんでした。

----
Jyunko Iwasaki  jyunko@xxxxxxxxxxxxxxxxxxx