Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: PDF ファイルの全文検索について
横堀です。
山下@リムネットさん、足立さん ありがとうございます。
ご教授通りpathの設定を行ったところ、下記の出力は出なくなりました。
(コントロールパネルのシステムにてPATHの設定)
C:\Program Files\Xpdf\japanese\add-to-xpdfrc の編集もすませました。
/usr/local/share/xpdf/japanese/を
/C/Progra~1/Xpdf/japanese に編集
------------------------------------------------------------------
'C:\Program' は、内部コマンドまたは外部コマンド、
操作可能なプログラムまたはバッチ ファイルとして認識されていません。
------------------------------------------------------------------
pdftotextを実行したところ下記のように正常と思われます。
------------------------------------------------------------------
C:\>pdftotext
pdftotext version 1.00
Copyright 1996-2002 Derek B. Noonburg
Usage: pdftotext [options] <PDF-file> [<text-file>]
-f <int> : first page to convert
-l <int> : last page to convert
-raw : keep strings in content stream order
-htmlmeta : generate a simple HTML file, including the meta information
-enc <string> : output text encoding name
-eol <string> : output end-of-line convention (unix, dos, or mac)
-opw <string> : owner password (for encrypted files)
-upw <string> : user password (for encrypted files)
-q : don't print any messages or errors
-cfg <string> : configuration file to use in place of .xpdfrc
-v : print copyright and version info
-h : print usage information
-help : print usage information
--help : print usage information
-? : print usage information
------------------------------------------------------------------
しかし、今度は下記のような出力になってしました。
------------------------------------------------------------------
1/1 - /e|/homepages/home/doc/postbook/index.pdf Unable to convert pdf file (me copying protection)
[追加]
日付: Fri Mar 1 14:01:11 2002
合計の文書数: 16
合計キーワード数: 2,745
わかち書き: module_kakasi -ieuc -oeuc -w
経過時間 (秒): 9
ファイル/秒: 0.00
システム: MSWin32
Perl: 5.006001
Namazu: 2.0.10
------------------------------------------------------------------
使用したPDFファイルは、
PostgreSQL本(通称:シーラカンス本
>http://www.sra.co.jp/people/t-ishii/PostgreSQL/postbook/
で、試しています。
何か参考になるご意見をお待ちしてます。
Hiroshi ADACHI <adachi@xxxxxxxxxxxxxxxxxxxxxx> wrote:
> 足立 です。
>
> もうすこしですね。
> がんばってください。(^-^)
>
>
> Yokoboriさんは
> 02/02/28付 「[namazu-win32-users-ja] Re: PDF ファイルの全文検索について」で
> 書きました。
> > 横堀と申します。
> >
> >柴崎さんの説明で、足立さんもできたとのことですが、私はどうもうまくいきませ
> ん。
> >
> >
> > >5. pdftotext.exe のありかをPATHに追加(必要ないかもしれません)。
> >
> >まずはWindowsのコマンドプロンプトで。「path C:\Program Files\Xpdf;%path%」
> を入力しました。
>
> これでは二重でまずいのでは。
>
> 1. コマンドプロンプトでパスを変更しても、このプロセスを終われば忘れてしまう。
> 下の call mknmz ..以下を同じプロセスで実行すれば問題ないですが。
> 2. "path C:\Program Files\Xpdf;%path%" ではスペースはデリミタとして働くため、
> パスがうまく通らないのではないかと思います。
> path C:\Progra~1\Xpdf;%path% としましょう。
>
> "Progra~1" はもしかしたらお使いのPCによって違うかもしれません。
>
> dir c:\ /X[ret]
> を実行して、MS-DOS形式のディレクトリを確認し、それを使ってください。
>
>
>
> うまくいったかどうかの確認は、同じプロセスの任意のフォルダで
> pdftotext[RET]とタイプしてやれば、
>
> pdftotext version 1.00
> copyright(略)....
> ....
> と表示されるはずです。
> 多分、パスが通っていなくて、こうならないのではないかと思います。
>
>
> ----
> Hiroshi ADACHI
> adachi@xxxxxxxxxxxxxxxxxxxxxx
>
>