Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

PDFの日本語タイトルが表示されない



嶋と申します。

環境:
RedHatt7.2
Namazu2.0.12
xpdf-2.03(xpdf-japanese)

XPDFを利用してNamazuでPDFの検索を行っています。過去のメイルにも
同じような質問がありましたが、パッチを適用しても現象が変わらず質問
してみました。
現象としましては、PDFファイルの概要(pdfinfo)で取得する値が全文検索
タイトルに表示されないというものです。自分で検証した内容を記載します。

エンコード指定でpdftotextでpdfファイルをテキスト変換---正常に処理
エンコード指定でpdfinfoでpdfファイルのプロパティを取得--正常に処理

pdf.plの内容を見てみたらpdftotextの場合は、エンコードが自動的にセット
される様子でしたので問題なしと判断しました。次にpdfinfoのところでエン
コード指定がされていない様子だったので「-enc EUC-JP」を追加しました。
これで期待通りの動作をするかと思いましたが、やはり日本語のプロパティ
を設定しているpdfファイルのタイトルが表示されませんでした。
結局、どこに問題があるのかわからず困っています。

補足:
プロパティに日本語(マルチバイト)を設定した場合のみ全文検索結果の
タイトルが表示されず、半角英数をプロパティにセットした場合は全文検索
結果として表示されます。実は、「pdf.pl」の問題ではないのかな?と思って
います。


お手数ですが、どなたかご教授ください。
以上です。宜しくお願いします。