Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

pdf の全文検索の設定方法



足立@静岡です。

初めまして。
今回MLに加えさせていただきました。

早速で申し訳ないのですが、質問させてください。



日本語pdfファイルを全文検索の対象に加えたいのですが、マニュアルにある、
>pdf.pl 
>PDF 文書を扱う 
>必需品: xpdf (バージョン 0.91 を推奨)に付属の pdftotextコマンド 
>注意: 日本語の PDF 文書を扱う場合、--enable-japanese で configure されたも
>のが必要 
の "注意"が理解できず、pdftotext.exeは持ってきたのですが、全くうまくいきま
せん。
#当方、UNIXに関しての知識に乏しいためでしょうか。

いろいろ探してみたのですが、この設定をまとめたものを発見できませんでした。
この部分を説明したリンク等があれば 教えていただけませんでしょうか。


mknmz -C の結果は以下の通りです。
この中に、tutorial.htmlにあるものと異なり、 application/pdf がないのも既に
変なのでしょうか。
-------------------------------------------------------------
読み込んだ設定ファイル: C:/namazu/etc/namazu/mknmzrc
システム: MSWin32
Namazu: 2.0.5
Perl: 5.006
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: no -j -F '%m '
わかち書き: module_kakasi -ieuc -oeuc -w
言語: ja_JP.SJIS
文字コード: sjis
CONFDIR: C:/namazu/etc/namazu
LIBDIR: C:/namazu/share/namazu/pl
FILTERDIR: C:/namazu/share/namazu/filter
TEMPLATEDIR: C:/namazu/share/namazu/template
対応メディアタイプ: 
  application/excel
  application/msword
  application/powerpoint
  application/x-gzip
  message/news
  message/rfc822
  text/hnf
  text/html
  text/html; x-type=mhonarc
  text/plain
  text/plain; x-type=rfc
-------------------------------------------------------------


よろしくおねがいします。