Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: pdf の全文検索の設定方法
足立@静岡です。
Mitsuo Satou さんは書きました:
>ども、佐藤@自宅です。
すいません、お世話になります。
>On Fri, 22 Dec 2000 10:23:14 +0900
>Hiroshi ADACHI <adachi@xxxxxxxxxxxxxxxxxxxxxx> wrote:
>
>> これらのことから、日本語の処理がうまくいっていないのではないか、と思ったの
>> です。
>
>以下のページを参考にしてPDFを試した所、インデックスが作成できました。
> http://www5.big.or.jp/~susumu/ih_pdfsearch/
>
>【作業内容】
>1.pdftotext.exe の準備
(以下略)
情報のご提供ありがとうございました。
早速やってみました。
しかし残念ながら、従来と同様、インデックスは出来ますがやはり日本語の検索は出
来ないようです。(英数字は出来ます)
佐藤さんの環境では、日本語の検索が出来ているんですよね。
どこが違うのだろう。
xpdfのソースをダウンロードしてINSTALLファイルをよんでみたのですが、これによる
と、日本語のとおるpdftotext.exeは、以下のオプションを付けてconfigureスクリプ
トをはしらせろと書いてあるようです。ただし、これはUNIXシステムについての説明
で、Winについては同様の記述はありません。
私、UNIXは殆ど知らないのですが、configureとはコンパイルしてexeを作り直すこと
でしょうか。
佐藤さんが日本語検索が出来ているとすると、Winはこの機能を含ませて実行ファイル
が作られているのでしょうか。
INSTALLファイルによると、
>* Run the configure script:
> ./configure
(略)
> --enable-japanese
> Enables support for 16-bit Japanese fonts. This increases the
> size of the binary (mostly with decoding tables). The default
> is no Japanese font support.
(略)
私の環境は以下の通りです。NTとAcrobat(readerではない)だけ異なります。
【動作確認環境】
・WindowsNTsp6
・namazu 2.0.5
・kakasi 2.3.2
・ActivePerl 5.6.0.620
・AN HTTPD 1.32f
・pdftotext 0.92(xpdf-0.92-win32-ms.zip)
・gzip 1.2.4
・Acrobat 4.05J