平沢です。
>1. PDF だけが文字化けする。また、文字化けは日本語部分である。
>2. PDF のファイル名は日本語ではない。 >3. pdftotext を使っている。 >もし当てはまっているのであれば、おそらくは pdftotext(xpdf 全体)が >日本語対応していない古いバージョンなのか、日本語のモジュールが >インストールされていない、または設定に不備があるのではないで >しょうか? >とりあえず、pdftotext のバージョンは何でしょう。 お答えありがとうございます。
1と2は当てはまっています。
3に関してはサーバーに問い合わせをしないとわかりませんが・・
これは問い合わせをして答えて頂ける性質のものなのでしょうか?
それから、書き忘れましがPDFの文字化けは一部分なのですが(全て文字化け
する訳ではないという現象です)正常にテキスト化されて検索可能なPDFファイル
もあります。その場合もpdftotextに関係していますか?
いずれこちらで原因をある程度分かった上でサーバーに問い合わせたいと考えています。
|