Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: pdfインデックス作成について(RedHat7.3)



大室 です。

結果から報告させて頂きますと、Language Support Packages を
インストール、設定する事で解決しました。
臼田 様からのメールを参考にさせて頂きました。

過去ログも合わせて参考にさせて頂きました。
PDFファイルのインデックス作成について
xpdf-1.01       など

うまくいきました。
皆様有り難うございました。


 >> redhat Linux 7.3 標準インストール時に既にインストール済み
 >> namazu 2.0.10-4
 >
 >2.0.10-4 って何だろう? とりあえず 2.0.12 を使いましょう。

2.0.10 です。
# rpm -q namazu で調べました。
2.0.12を使うように準備します。
今回はこのまま2.0.10を使いました。
pdf.plの修正を行いました。(下記参照)

 >
 >> nkf 1.92-6
 >
 >基本的に nkf 1.9* 系はダメです。1.92-6 というのが、修正済みのバージョン
 >でしたらいいのですが...。
 > 

修正済みかどうか未確認です。
今回はそのまま使いました。

 >> xpdf 1.00-3
 >
 >ランゲージパックはインストールされていますか?
 >なお、xpdf 2.02 以降をお勧めします。
 >
Language Support Packages の問題でした。
今回はそのまま使いました。

 >> 初期インストールの状態で
 >> $mknmz -a  index とすると pdfファイルに関して
 >> pdftotext version 1.00
 >> Copyright 1996-2002 Derek B. Noonburg
 >> Usage: pdftotext [options] <PDF-file> [<text-file>]
 >>   <中略>
 >>   -?                : print usage information
 >> のようなメッセージが出力されました。
 >
 >2.0.12 では対策済みです。
 >
 >> 次に /usr/share/namazu/filter/pdf.pl を修正
 >> ------------------------------------------------------------------------
 >> ###     system("$pdfconvpath -q -eucjp -raw $tmpfile $tmpfile2");
 >>         system("$pdfconvpath -q -enc -EUC-JP -raw $tmpfile $tmpfile2");
 >> ------------------------------------------------------------------------
-
 >
 >おそらく system("$pdfconvpath -q -enc EUC-JP -raw $tmpfile $tmpfile2");
 >の間違いではないかと思いますが。(-EUC-JP ではなくて)
 >

ご指摘の通りです。
 -enc -EUC-JP ではなく -enc EUC-JP でした。

 >> 結果
 >> Unable to convert pdf file (maybecopying protection) なる
 >> メッセージが出力され変換できません。
 >
 >菅さんが既に指摘していますが、このメッセージを信じるならパスワード付きの 
 >PDF ファイルではないかと思いますが、いかがでしょう。
 >その PDF ファイルは acrobatreader でパスワード入力なしに開くことが
 >できるのでしょうか?
 > 

パスワード付きでは有りませんでした。


--------------------------------------------------
Ichiro.Ohmuro
    gly46141@xxxxxxxxxxxxxxx