Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: pdftotext が Distiller で書き出された PDF から日本語を取り出せない件
足立@静岡です。
しばらく前に私もこの話題を出させていただきました。
その時の結論も、Writerを使うことでした。
その時も佐藤さんの環境では日本語が取り出せているとのことでしたので、
その後もDistillerの設定をいろいろいじってみましたが、結果としては未だ解決出
来ていません。
font関連の設定が臭いといろいろいじってみたのですが。
これだけじゃつまらないので、他の話題を。
最近Win2KのPCに入れ替えました。それについてくる全文検索(インデックスサービス)
を入れてみました。
これに PDF ifilterというadobeが提供しているソフトを導入すると日本語PDFも検索
できます。前述のDistillerで作ったものでもOKです。
このifilterを pdftotextの代わりに使って出来ないでしょうかねえ。
私にはとても手に負えそうに無いので、こちらに振ってみたりして...。)^o^(
ifilterは、 http://www.adobe.com/support/downloads/8126.htm にあります。
s a k a k iさんは
2001/02/14 18:28:46付 「[namazu-win32-users-ja] Re: pdftotext が Distiller で書
き出された PDF から日本語を取り出せない件」 で書きました。
>
> 榊です。自己レス・・・
> 下記件ですが、元ファイルをPDF Writerで焼き直すことで解決しました。
> Distiller出力でも日本語を取り出せるファイルもありましたので、
> 設定次第でDistillerでもいけるのかもしれませんが、未検証です。
------
Hiroshi ADACHI