Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: PDF ファイルの全文検索について



横堀です。

山下@リムネットさん、足立さん ありがとうございます。

ご教授通りpathの設定を行ったところ、下記の出力は出なくなりました。
(コントロールパネルのシステムにてPATHの設定)
 C:\Program Files\Xpdf\japanese\add-to-xpdfrc の編集もすませました。
 	/usr/local/share/xpdf/japanese/を
	/C/Progra~1/Xpdf/japanese に編集
------------------------------------------------------------------
'C:\Program' は、内部コマンドまたは外部コマンド、
操作可能なプログラムまたはバッチ ファイルとして認識されていません。
------------------------------------------------------------------


pdftotextを実行したところ下記のように正常と思われます。
------------------------------------------------------------------
C:\>pdftotext
pdftotext version 1.00
Copyright 1996-2002 Derek B. Noonburg
Usage: pdftotext [options] <PDF-file> [<text-file>]
  -f <int>          : first page to convert
  -l <int>          : last page to convert
  -raw              : keep strings in content stream order
  -htmlmeta         : generate a simple HTML file, including the meta information
  -enc <string>     : output text encoding name
  -eol <string>     : output end-of-line convention (unix, dos, or mac)
  -opw <string>     : owner password (for encrypted files)
  -upw <string>     : user password (for encrypted files)
  -q                : don't print any messages or errors
  -cfg <string>     : configuration file to use in place of .xpdfrc
  -v                : print copyright and version info
  -h                : print usage information
  -help             : print usage information
  --help            : print usage information
  -?                : print usage information
------------------------------------------------------------------


しかし、今度は下記のような出力になってしました。
------------------------------------------------------------------
1/1 - /e|/homepages/home/doc/postbook/index.pdf Unable to convert pdf file (me copying protection)
[追加]
日付:                Fri Mar  1 14:01:11 2002
合計の文書数:        16
合計キーワード数:    2,745
わかち書き:          module_kakasi -ieuc -oeuc -w
経過時間 (秒):       9
ファイル/秒:         0.00
システム:            MSWin32
Perl:                5.006001
Namazu:              2.0.10
------------------------------------------------------------------


使用したPDFファイルは、
PostgreSQL本(通称:シーラカンス本
>http://www.sra.co.jp/people/t-ishii/PostgreSQL/postbook/
で、試しています。

何か参考になるご意見をお待ちしてます。









Hiroshi ADACHI <adachi@xxxxxxxxxxxxxxxxxxxxxx> wrote:

> 足立 です。
> 
> もうすこしですね。
> がんばってください。(^-^)
> 
> 
> Yokoboriさんは
> 02/02/28付 「[namazu-win32-users-ja] Re: PDF ファイルの全文検索について」で
> 書きました。
>  > 横堀と申します。
>  >
>  >柴崎さんの説明で、足立さんもできたとのことですが、私はどうもうまくいきませ
> ん。
>  >
>  >
>  > >5. pdftotext.exe のありかをPATHに追加(必要ないかもしれません)。
>  >
>  >まずはWindowsのコマンドプロンプトで。「path C:\Program Files\Xpdf;%path%」
> を入力しました。
> 
> これでは二重でまずいのでは。
> 
> 1. コマンドプロンプトでパスを変更しても、このプロセスを終われば忘れてしまう。
>   下の call mknmz ..以下を同じプロセスで実行すれば問題ないですが。
> 2. "path C:\Program Files\Xpdf;%path%" ではスペースはデリミタとして働くため、
>     パスがうまく通らないのではないかと思います。
>    path C:\Progra~1\Xpdf;%path% としましょう。
> 
> "Progra~1" はもしかしたらお使いのPCによって違うかもしれません。
> 
>  dir c:\ /X[ret]
> を実行して、MS-DOS形式のディレクトリを確認し、それを使ってください。
> 
> 
> 
> うまくいったかどうかの確認は、同じプロセスの任意のフォルダで
>  pdftotext[RET]とタイプしてやれば、
> 
>  pdftotext version 1.00
>  copyright(略)....
>  ....
> と表示されるはずです。
> 多分、パスが通っていなくて、こうならないのではないかと思います。
> 
> 
> ----
> Hiroshi ADACHI
> adachi@xxxxxxxxxxxxxxxxxxxxxx
> 
>