Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
pdf の全文検索の設定方法
- From: Hiroshi ADACHI <adachi@xxxxxxxxxxxxxxxxxxxxxx>
- Date: Thu, 21 Dec 2000 18:51:55 +0900
- X-ml-name: namazu-win32-users-ja
- X-mail-count: 00484
足立@静岡です。
初めまして。
今回MLに加えさせていただきました。
早速で申し訳ないのですが、質問させてください。
日本語pdfファイルを全文検索の対象に加えたいのですが、マニュアルにある、
>pdf.pl
>PDF 文書を扱う
>必需品: xpdf (バージョン 0.91 を推奨)に付属の pdftotextコマンド
>注意: 日本語の PDF 文書を扱う場合、--enable-japanese で configure されたも
>のが必要
の "注意"が理解できず、pdftotext.exeは持ってきたのですが、全くうまくいきま
せん。
#当方、UNIXに関しての知識に乏しいためでしょうか。
いろいろ探してみたのですが、この設定をまとめたものを発見できませんでした。
この部分を説明したリンク等があれば 教えていただけませんでしょうか。
mknmz -C の結果は以下の通りです。
この中に、tutorial.htmlにあるものと異なり、 application/pdf がないのも既に
変なのでしょうか。
-------------------------------------------------------------
読み込んだ設定ファイル: C:/namazu/etc/namazu/mknmzrc
システム: MSWin32
Namazu: 2.0.5
Perl: 5.006
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: no -j -F '%m '
わかち書き: module_kakasi -ieuc -oeuc -w
言語: ja_JP.SJIS
文字コード: sjis
CONFDIR: C:/namazu/etc/namazu
LIBDIR: C:/namazu/share/namazu/pl
FILTERDIR: C:/namazu/share/namazu/filter
TEMPLATEDIR: C:/namazu/share/namazu/template
対応メディアタイプ:
application/excel
application/msword
application/powerpoint
application/x-gzip
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; x-type=rfc
-------------------------------------------------------------
よろしくおねがいします。