Namazu-win32-users-ja(旧)

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: pdf の全文検索の設定方法

From: Hiroshi ADACHI <adachi@xxxxxxxxxxxxxxxxxxxxxx>
Date: Mon, 25 Dec 2000 18:45:51 +0900
X-ml-name: namazu-win32-users-ja
X-mail-count: 00502
References: <20001225113357kRDaAl@daiwakantei.co.jp>

足立＠静岡 です。

satou さんは書きました:
>佐藤＠大和鑑定です。
>【使用したPDF】
>石井さんのPostgreSQL本（通称：シーラカンス本(^^;）
>http://www.sra.co.jp/people/t-ishii/PostgreSQL/postbook/
>
>
>> 佐藤さんの環境では、日本語の検索が出来ているんですよね。
>> どこが違うのだろう。
>
>はい、Windows98SEとNT4.0ともに日本語の要約が表示されます。
>一度上記のPDFで試してみてはいかがでしょうか？
このpdfだと、うまく処理できます。
いろいろトライしてみると、出来るものと出来ないものがあるようです。

どうやら、acrobatには acrobat PDF writerと PDF Distiller の2つの作成方法が
あるのですが、前者で作ったものだとうまく日本語処理できて、後者だとダメみたい
です。新発見。
acrobat PDF writer は設定する項目がないですが、PDF Distiller はいろいろあり
ます。このあたりをいじってもう少しトライしてみます。


>上手くいかないPDFをコマンドレベルで変換したらどうなりますか？
これに従い、DOSプロンプトから手でやってみると、pdftotext.exeは 後者の場合
Error:Unknown Type 0 charactor set: Adobe-Identify 
をはきます。前者はエラー出ず。

>この場合EUCに変換されるので、私は以下のエディタを利用しています。
>TeraPad Ver 0.61 
>http://www2s.biglobe.ne.jp/~t-susumu/toclip/
私は秀丸使ってます。


うーん。pdf作成者全員に作成方法を指定できないし。困りました。

Follow-Ups:
- Re: pdf の全文検索の設定方法
  - From: satou

References:
- Re: pdf の全文検索の設定方法
  - From: satou

Prev by Date: Re: pdf の全文検索の設定方法
Next by Date: Re: pdf の全文検索の設定方法
Previous by thread: Re: pdf の全文検索の設定方法
Next by thread: Re: pdf の全文検索の設定方法
Index(es):
- Date
- Thread