Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: pdfファイルの検索について
confirm 20030513141950869771743321 Hiroki Hiraya
平屋です。
On Wed, 27 Aug 2003 13:07:49 +0900
Tadamasa Teranishi <yw3t-trns@xxxxxxxxxxxxxxx> wrote:
> 寺西です。
> > 7.ではファイル名が表示されない件についてご教授願います。
>
> こちらは、昨日の質問と同じ件だと思われますので、過去ログをまずは
> お調べください。
メールを出した後気づきました申し訳ありません。
> > 検索画面でpdfファイルの名前で直接検索したところ、
> >
> > 6. 5-7.pdf (スコア: 17)
> > 著者: 不明
> > 日付: Fri, 04 Jul 2003 14:27:15
> > TEL TEL TEL TEL TEL TEL TEL TEL TEL TEL TEL
> > http://*/0302/pdf/5-7.pdf (1,166,709 bytes)
> ...
> > 6.のファイルを
> > pdftotext -q -euc EUC-JP でtxtに変換すると
> > 日本語で読むことはできました。
>
> 変換したテキストファイルは何でどのようにして確認しましたか?
> 変換したテキストファイルを vi で開くとどうなりますか?
viを使用して普通に開き、読むことはできました。
> 制御コードとTEL が大量に入っているということはありませんか?
見た感じでは制御コードとTELは大量に入っておりませんでした。
>
> 基本的には pdftotext の変換結果のファイル先頭部分が summary に使われ
> ます。(PDF のレイアウトで最初の部分とは限りません。)
> pdftotext の結果と大きく異なるようでしたら、再現できる pdf ファイルを
> ご用意していただければ、調査することは可能です。
pdfファイルをお客様のデータですので送ることができません。
pdfinfoの結果をお送りいたします。
pdfファイルの内容は5コラムで3ページほどになっております。
Producer: Acrobat Distiller 4.05 for Macintosh
CreationDate: Fri Jun 27 15:02:00 2003
ModDate: Fri Jul 04 14:00:35 2003
Tagged: no
Pages: 3
Encrypted: no
Page size: 847 x 1224 pts
File size: 1086835 bytes
Optimized: yes
PDF version: 1.4
他に必要な情報がありましたら、公開できる範囲で
公開することは可能ですので、ご対応のほど宜しくお願いいたします。
以上、宜しくお願いいたします。
> --
_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/
パナソニック ソリューションテクノロジー株式会社
東日本SIグループソリューション第1チーム
平屋 宏記(Hiroki Hiraya)
hiraya@xxxxxxxxxxxxxxx
_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/