Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
 Re: PDF のプロパティを検索する方法
- From: Tadamasa Teranishi <yw3t-trns@xxxxxxxxxxxxxxx>
 
- Date: Thu, 26 Apr 2001 19:06:52 +0900
 
- X-ml-name: namazu-users-ja
 
- X-mail-count: 01713
 
- References: <3AE7912C.EC1826E@ncos.nec.co.jp>
 
寺西@久々の書き込みです。
永野 wrote:
> 
> PDFのデータは検索できるのですが、
> 
> プロパティ情報(タイトル/サブタイトル/作成者/キーワード)での
> 検索は可能でしょうか?
きちんとした回答ができませんが。
まず、pdftotext で出力されるテキストにプロパティ情報が出力されて
いるでしょうか? 確か含まれていないと思います。
ですので、検索できないということにないます。(少なくとも
今のところ)
プロパティ情報が出力されていれば、検索そのものは可能でしょうが、
タイトルに XXXX が含まれるものといった個別の検索まではむずかしい
でしょう。
pdfinfo というコマンドでは、
% pdfinfo acrobat4.pdf
Title:
Subject:
Keywords:     namazu test Acrobat4
Author:       test@xxxxxxxxxx
Creator:
Producer:     Acrobat PDFWriter 4.0 Windows
CreationDate: 20000215090710
ModDate:      20000215091117+09'00'
Pages:        1
Encrypted:    no
Linearized:   yes
というような出力が得られます。日本語に対応していれば
良いのですが、残念ながら対応していません。
英語でよければ、この出力を検索するようにフィルタを作成すれば
望みはかなうでしょう。
--
寺西