Namazu-win32-users-ja(旧)

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: pdf の全文検索の設定方法

From: Hiroshi ADACHI <adachi@xxxxxxxxxxxxxxxxxxxxxx>
Date: Mon, 25 Dec 2000 09:39:53 +0900
X-ml-name: namazu-win32-users-ja
X-mail-count: 00500
References: <20001224141424.0E00.SATOU@osk.3web.ne.jp>

足立＠静岡です。


Mitsuo Satou さんは書きました:
>ども、佐藤＠自宅です。
すいません、お世話になります。

>On Fri, 22 Dec 2000 10:23:14 +0900
>Hiroshi ADACHI <adachi@xxxxxxxxxxxxxxxxxxxxxx> wrote:
>
>> これらのことから、日本語の処理がうまくいっていないのではないか、と思ったの
>> です。
>
>以下のページを参考にしてPDFを試した所、インデックスが作成できました。
>　http://www5.big.or.jp/~susumu/ih_pdfsearch/
>
>【作業内容】
>１．pdftotext.exe の準備
(以下略)

情報のご提供ありがとうございました。
早速やってみました。
しかし残念ながら、従来と同様、インデックスは出来ますがやはり日本語の検索は出
来ないようです。(英数字は出来ます)

佐藤さんの環境では、日本語の検索が出来ているんですよね。
どこが違うのだろう。


xpdfのソースをダウンロードしてINSTALLファイルをよんでみたのですが、これによる
と、日本語のとおるpdftotext.exeは、以下のオプションを付けてconfigureスクリプ
トをはしらせろと書いてあるようです。ただし、これはUNIXシステムについての説明
で、Winについては同様の記述はありません。
私、UNIXは殆ど知らないのですが、configureとはコンパイルしてexeを作り直すこと
でしょうか。
佐藤さんが日本語検索が出来ているとすると、Winはこの機能を含ませて実行ファイル
が作られているのでしょうか。

INSTALLファイルによると、
>* Run the configure script:
>    ./configure
(略)
>    --enable-japanese
>        Enables support for 16-bit Japanese fonts.  This increases the
>        size of the binary (mostly with decoding tables).  The default
>        is no Japanese font support.
(略)


私の環境は以下の通りです。NTとAcrobat(readerではない)だけ異なります。
【動作確認環境】
　・WindowsNTsp6
　・namazu 2.0.5
　・kakasi 2.3.2
　・ActivePerl 5.6.0.620
　・AN HTTPD 1.32f
　・pdftotext 0.92（xpdf-0.92-win32-ms.zip）
　・gzip 1.2.4
　・Acrobat 4.05J

Follow-Ups:
- Re: pdf の全文検索の設定方法
  - From: satou

References:
- Re: pdf の全文検索の設定方法
  - From: Mitsuo Satou

Prev by Date: Re: UFT-8 の HTML ドキュメントで文字化け
Next by Date: Re: pdf の全文検索の設定方法
Previous by thread: Re: pdf の全文検索の設定方法
Next by thread: Re: pdf の全文検索の設定方法
Index(es):
- Date
- Thread