Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
(Re: mknmzrcの記述でperlのエラー)「(application/pdf)未対応の形式」エラー
- From: "yo yo" <yoyo_aya_study@xxxxxxxxxxx>
- Date: Thu, 09 Jan 2003 11:37:58 +0900
- X-ml-name: namazu-users-ja
- X-mail-count: 02981
yoyoです。
> > そこにセミコロンを書くと、インデックス化対象ファイルが
> > HTMLとテキスト「だけ」になりますが、それでよろしいのですね?
>
> mknmz実行時のオプション指定によっては、「だけ」じゃないかも
> しれません。
ご指摘ありがとうございます。
あとPDFファイルも対象としたいので
mknmzrcを
$ALLOW_FILE = ".*\\.(?:$HTML_SUFFIX)|.*\\.txt" . # HTML, plain text
# "|.*\\.gz|.*\\.Z|.*\\.bz2" . # Compressed files
"|.*\\.pdf" ; # PDF
# "|.*\\.tex" . # TeX
# "|.*\\.doc|.*\\.xls" . # Word, Excel
# "|.*\\.j[sab]w" . # Ichitaro 4, 5, 6
# "|\\d+|[-\\w]+\\.[1-9n]"; # Mail/News, man
にしました。
するとperlのエラーは出ないのですが、
インデキシングの際にpdfファイル全てに「(application/pdf)未対応の形式」と
出てしまいます。
ファイルサイズも100kbのものもあれば1Mもあるのですが全てインデキシングされま
せん。
mknmzrcの下のほうの記述($EXCLUDE_PATH 以下)は
$TEXT_SIZE_MAX = 1500000;
以外全てコメントアウトしています。
過去ログを見てみるとpdftotextというツールをいれるのかなとも思うのですが。
_________________________________________________________________
ネットを使うひとに有利な特典いっぱい MSN カード http://card.msn.co.jp/