namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: ps/pdf to text
- From: kenzo-@xxxxxxxxxx (Ken-ichi Hirose)
- Date: Sat, 22 Aug 1998 02:41:50 +0900
- X-ml-name: namazu
- X-mail-count: 01041
<19980822012634T.ccsatoru@xxxxxxxxxxxxxxxxxx>の記事において
ccsatoru@xxxxxxxxxxxxxxxxxxさんは書きました。
広瀬です。
>> >久しぶりに fj.unix を見ていたらこんなんがあるそうです。
>> ><URL:http://www.research.digital.com/SRC/virtualpaper/pstotext.html>
>> ちょっと試してみたところ日本語は PostScript, PDFともにだめみたいで
>> す (英語の文書は OKでした)。
>> 上記のウェブペイジによると
>> >to pstotext. This information includes character metrics and
>> >encoding vectors, so in most situations we're able to reconstruct
>> >the plain text (converted to ISO Latin 1 encoding), with correct
>> ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
>> >word breaks and good guesses about line breaks. It even works for
>> >rotated text!
>> だそうなので、きっと日本語は扱えないのでしょう。
>> # 日本語の PostScript, PDF のエンコーディングってどうなっているの?
そうなのですか。。残念。 ;-)
#まだ自分で試してないのですが。。
そういえばいつの間にか mswordview が 0.2.1 になってる。。 ^^;
Best regards,
--
Ken-ichi Hirose (^^)k!
e-mail: kenzo-@xxxxxxxxxx (or) EHC25612@xxxxxxxxxxx