Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: PDF ファイルの全文検索について



 横堀と申します。

柴崎さんの説明で、足立さんもできたとのことですが、私はどうもうまくいきません。


>さっきMLに登録したばかりの芝崎と申します。
 >
 >
 >私も、PDF文書を Windows 2000 Professional にインストールした Namazu から
 >検索しようと思って四苦八苦した末成功しましたので、簡単なメモを投稿します。
 >
 >・xpdf: version 1.00を使用
 >1. XPDF: ftp://ftp.foolabs.com/pub/xpdf/xpdf-1.00-win32.zip
 >C:\Program Files\Xpdfに展開。
 >
 >2. Japanese Language Support Package:
 >ftp://ftp.foolabs.com/pub/xpdf/xpdf-japanese.tar.gz を
 >C:\Program Files\Xpdfに展開。
 >
 >3. C:\Program Files\Xpdf\japanese\add-to-xpdfrc を編集(オリジナルも念のた
 >め保存しておく)。
 >編集内容:/usr/local/share/xpdf/japanese/を Windows のパス名に置き換える。


xpdf-japanese.tar.gz を C:\Program Files\Xpdfに展開してもjapanesフォルダがないため作成して展開しました。(Xpdf内にjapaneseフォルダを作成せず、展開したパターンでも行いました。それぞれに対応したパス名も編集しました)


 >
 >4. 編集した C:\Program Files\Xpdf\japanese\add-to-xpdfrc を
 >C:\Program Files\Xpdf\xpdfrcの最後に追加。
 >
 >5. pdftotext.exe のありかをPATHに追加(必要ないかもしれません)。


まずはWindowsのコマンドプロンプトで。「path C:\Program Files\Xpdf;%path%」を入力しました。

 >
 >6. C:\namazu\share\namazu\filter\pdf.plを編集(オリジナルも念のため保存しておく)。
 >73行目
 >-	system("$pdfconvpath -q -eucjp -raw $tmpfile $tmpfile2");
 >+	system("$pdfconvpath -q -enc EUC-JP -raw $tmpfile $tmpfile2");
 >
 >#pdftotext のコマンドラインオプションが変わったのでしょう
 >
 >これで動きましたが、XPDFの古いバージョンでは、違うやり方になると思います。
 >
 >それでは
 >
 >-- 
 >SHIBAZAKI, Masanobu / 芝崎 真信
 >mshiba@xxxxxxxxxxxxxxxx


この状態で、インデックスを作ろうとすると下記のようなメッセージになります。

---------------------------------------------------------------------
C:\>call mknmz -O c:\namazu\var\namazu\index e:\homepages\home
検索対象のファイルを調べています...
30個のファイルがインデックス作成の対象として見つかりました
'C:\Program' は、内部コマンドまたは外部コマンド、
操作可能なプログラムまたはバッチ ファイルとして認識されていません。
1/4 - /e|/homepages/home/postbook/index.pdf Unable to convert pdf file (maybe copying protection)
---------------------------------------------------------------------

何か設定で参考になることがありましたらご教授ください。
(textは検索できます。)

Yokobori Norimasa
nyokobori@xxxxxxxxxxxxxx