Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: pdfインデックス作成について(RedHat7.3)
大室 です。
結果から報告させて頂きますと、Language Support Packages を
インストール、設定する事で解決しました。
臼田 様からのメールを参考にさせて頂きました。
過去ログも合わせて参考にさせて頂きました。
PDFファイルのインデックス作成について
xpdf-1.01 など
うまくいきました。
皆様有り難うございました。
>> redhat Linux 7.3 標準インストール時に既にインストール済み
>> namazu 2.0.10-4
>
>2.0.10-4 って何だろう? とりあえず 2.0.12 を使いましょう。
2.0.10 です。
# rpm -q namazu で調べました。
2.0.12を使うように準備します。
今回はこのまま2.0.10を使いました。
pdf.plの修正を行いました。(下記参照)
>
>> nkf 1.92-6
>
>基本的に nkf 1.9* 系はダメです。1.92-6 というのが、修正済みのバージョン
>でしたらいいのですが...。
>
修正済みかどうか未確認です。
今回はそのまま使いました。
>> xpdf 1.00-3
>
>ランゲージパックはインストールされていますか?
>なお、xpdf 2.02 以降をお勧めします。
>
Language Support Packages の問題でした。
今回はそのまま使いました。
>> 初期インストールの状態で
>> $mknmz -a index とすると pdfファイルに関して
>> pdftotext version 1.00
>> Copyright 1996-2002 Derek B. Noonburg
>> Usage: pdftotext [options] <PDF-file> [<text-file>]
>> <中略>
>> -? : print usage information
>> のようなメッセージが出力されました。
>
>2.0.12 では対策済みです。
>
>> 次に /usr/share/namazu/filter/pdf.pl を修正
>> ------------------------------------------------------------------------
>> ### system("$pdfconvpath -q -eucjp -raw $tmpfile $tmpfile2");
>> system("$pdfconvpath -q -enc -EUC-JP -raw $tmpfile $tmpfile2");
>> ------------------------------------------------------------------------
-
>
>おそらく system("$pdfconvpath -q -enc EUC-JP -raw $tmpfile $tmpfile2");
>の間違いではないかと思いますが。(-EUC-JP ではなくて)
>
ご指摘の通りです。
-enc -EUC-JP ではなく -enc EUC-JP でした。
>> 結果
>> Unable to convert pdf file (maybecopying protection) なる
>> メッセージが出力され変換できません。
>
>菅さんが既に指摘していますが、このメッセージを信じるならパスワード付きの
>PDF ファイルではないかと思いますが、いかがでしょう。
>その PDF ファイルは acrobatreader でパスワード入力なしに開くことが
>できるのでしょうか?
>
パスワード付きでは有りませんでした。
--------------------------------------------------
Ichiro.Ohmuro
gly46141@xxxxxxxxxxxxxxx