Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Excel から PDF にして PDF ファイルで検索結果がヒットしない
足立 です。
以前、私も同様のことに悩みました。
で、いろいろ試したのですが、以下の結論に(勝手に)達しました。
pdftotext.exeを用いたpdfファイルの検索については、元アプリの種類にかかわらず、
・pdf distillerを用いて作成したpdfファイルは中身の日本語検索は出来ない。この
ことは、distillerの条件をいろいろ変えてみても変わらない。原因はフォント回
りにあることは、pdftotext.exe をDOS窓から単独で起動してみるとでるエラーで
推定。もしくはacrobatのバージョンかもしれません。
・pdf writerを用いて作成したpdfファイルは中身の日本語検索は出来る。
・どちらも、半角英数字の検索は出来る。
よって、
>質問1
> ExcelをPDF化したものにたいての漢字・カタカナ検索は無理ですか?
については、もしかしたら、WORDはwriter、Excelはdistillerで変換されていません
か。確認してみてください。acrobatをお持ちなら確認できます。(acrobat readerか
らできるかはやったことないので、未確認です)
私は、distillerを捨てきれないので、現在、pdf検索は諦めています。
何か、対応できる方法があれば、是非知りたいです。
そろそろ acrobat5を買って試してみようかと考えています。
でも、望み薄でしょうか。
microsoftのindexサービス用のifilterみたいなのをadobeが出してくれると嬉しいの
ですが...。
>質問2
> 検索式内に半角カタカナを入力して「search!」ボタンをクリックすると検
索結果
>の検索式内が文字化けを起こしています。
これはhttpの仕様上仕方ないのでは?? 半角は使えないと思います...。
検索文章中の半角カナ文字列も、検索式内に全角カナで入れてsearch! 出来るのでは
ないですか。
環境は、
OS Windows NT 4.0WS SP6a / anhttpd
office 2000 acrobat4.0
perl 5.6.1
namazu 2.0.8
kakasi-2.3.4.zip
です。
----
Hiroshi ADACHI
adachi@xxxxxxxxxxxxxxxxxxxxxx