Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Excel から PDF にして PDF ファイルで検索結果がヒットしない



足立 です。

以前、私も同様のことに悩みました。

で、いろいろ試したのですが、以下の結論に(勝手に)達しました。

pdftotext.exeを用いたpdfファイルの検索については、元アプリの種類にかかわらず、
・pdf distillerを用いて作成したpdfファイルは中身の日本語検索は出来ない。この
 ことは、distillerの条件をいろいろ変えてみても変わらない。原因はフォント回
 りにあることは、pdftotext.exe をDOS窓から単独で起動してみるとでるエラーで
 推定。もしくはacrobatのバージョンかもしれません。
・pdf writerを用いて作成したpdfファイルは中身の日本語検索は出来る。
・どちらも、半角英数字の検索は出来る。

よって、
 >質問1
 >	ExcelをPDF化したものにたいての漢字・カタカナ検索は無理ですか?
については、もしかしたら、WORDはwriter、Excelはdistillerで変換されていません
か。確認してみてください。acrobatをお持ちなら確認できます。(acrobat readerか
らできるかはやったことないので、未確認です)


私は、distillerを捨てきれないので、現在、pdf検索は諦めています。
何か、対応できる方法があれば、是非知りたいです。


そろそろ acrobat5を買って試してみようかと考えています。
でも、望み薄でしょうか。
microsoftのindexサービス用のifilterみたいなのをadobeが出してくれると嬉しいの
ですが...。



 >質問2
 >	検索式内に半角カタカナを入力して「search!」ボタンをクリックすると検
索結果
 >の検索式内が文字化けを起こしています。
これはhttpの仕様上仕方ないのでは?? 半角は使えないと思います...。
検索文章中の半角カナ文字列も、検索式内に全角カナで入れてsearch! 出来るのでは
ないですか。



環境は、
	OS Windows NT 4.0WS SP6a / anhttpd
	office 2000 acrobat4.0
	perl  5.6.1
	namazu  2.0.8
	kakasi-2.3.4.zip
です。




----
Hiroshi ADACHI
adachi@xxxxxxxxxxxxxxxxxxxxxx