Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: pdfファイルの検索について
confirm 20030513141950869771743321 Hiroki Hiraya
平屋です。
On Wed, 27 Aug 2003 14:12:01 +0900
Tadamasa Teranishi <yw3t-trns@xxxxxxxxxxxxxxx> wrote:
> 寺西です。
>
> $ pdftotext -q -enc EUC-JP -raw 5-7.pdf test.txt
>
> この結果でも問題がなければ、謎ですね。
この結果でも問題はありませんでした。
>
> Windows 版の Acrobat で読み込んで、上書き保存したらどうなるで
> しょうか?
Readerしかなかったため、試すことができませんでした。
> $ mknmz --debug 5-7.pdf
>
> を実行するといろいろとデバッグ情報が出ます。
> // Field: summary: の結果はどうなっていますか?
// Field: summary: TEL TEL TEL TEL TEL TEL TEL TEL TEL TEL TEL TEL TEL TEL
// Field: from: 不明
// Field: date: Wed, 27 Aug 2003 14:29:19
// Field: title: 5-7.pdf
// Field: size: 1086835
// Field: uri: /72/logana/namazu/5-7.pdf
> // -- content -- の行以下は pdftotext の結果と同じものがでている
> でしょうか?
// -- content --
// TEL
// TEL
// TEL
の後にpdftotextの結果が出力されておりました。
> // -- wakatized bare content -- や
// tel
// tel
// tel
の後にpdftotextの結果が出力されておりました。
> // -- わかち書きされた内容 -- のところはどうなっていますか?
// tel
// tel
// tel
の後にpdftotextの結果が出力されておりました。
以上、宜しくお願いいたします。
_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/
パナソニック ソリューションテクノロジー株式会社
東日本SIグループソリューション第1チーム
平屋 宏記(Hiroki Hiraya)
hiraya@xxxxxxxxxxxxxxx
_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/