Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: namazu での PDF 検索について
寺西です。
arg00032@xxxxxxxxxxxxxxxxxx wrote:
>
> 現在namazuでの検索でPDFファイルを検索対象としているのですが
> 検索結果がファイル名となってしまいます。
仕様ですね。というと冷たいのですが。
> 検索対象としているPDFファイルには全てプロパティに
> 題名(タイトル)を設定してありますが
> 検索結果のタイトルとしては出てないようです。
...
> PDFフィルタ:pdftotext Ver 0.91
pdftotext は PDF ファイルから文字情報をテキストファイル
に取り出すプログラムです。
取り出されたものには、タイトルも含まれるのかもしれませんが、
どこがタイトルなのかは分かりません。単なるテキストですから。
というわけで、pdftotext に タイトルを取り出すオプションが
あるとか、PDF ファイルから簡単に直接タイトルを取り出すことが
できるのであれば、namazu で対応することは可能になるかと
思います。それが簡単にはできないのであれば、対応は難しい
でしょう。
perl のライブラリで PDF を扱えるものがいくつかありますが、
それらでできるのであれば、簡単に解決できるかもしれません。
# 何方か、そういう情報に詳しい方、いらっしゃいますか?
--
寺西