Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Pure Perl Excel用フィルタの使用方法 (was officeをインストールせずに、WordやExcelの検索を実現したい)
- From: Mineo Kasai <kasai@xxxxxxxxxxxxxxxxx>
- Date: Thu, 27 Feb 2003 21:24:43 +0900
- X-ml-name: namazu-win32-users-ja
- X-mail-count: 01745
- References: <104615072200003c8d@dns.ftec.co.jp>
いつもお世話になっております。NEC情報システムズの笠井 峰生です。
Tue, 25 Feb 2003 14:25:22 +0900 の
[namazu-win32-users-ja] officeをインストールせずに、WordやExcelの検索を実現したい への返信です。
>Webコンテンツは、Htmlだけではなく
>Word(.doc)、Excel(.xls)、PowerPoint(.ppt)の
>データが含まれているのですが、
>Namazuで上記3種類のファイルの検索を
>実現したいのです。
残念ながらExcelのみですがperlだけでインデックス化できるフィルタが
あります。
不親切がたたってか、ちっとも使ってるといってくれる人が現れないので
完全に放置してある^^;spreadexcel.plのご紹介です。spreadexcel.plは、
perlだけでExcelファイルをnamazuでインデックス化してしまおうという
代物です。1年近く黙々と動いてますので、全く使えないわけではないか
と思います。
メールの最後で、Windowsでのインストール方法を説明します。チャレン
ジャーな方は、一度お試しください。
なお、Excel2000無印で作成したファイルは、まれにインデックスかでき
ないことがあります。Spreadsheet::ParseExcelモジュールの作者さんに
検証してもらいたいと思っているのですが、当方ではエラーになるサンプ
ルのExcelがどうにも用意できません。そういうデータで、外に出しても
よいものがありましたら是非お知らせください。
よろしくお願いいたします。
1. spreadexcel.plのインストール
namazuのリポジトリからファイルを取得しnamazu\share\namazu\filter
にコピーします。
[namazu/contrib/spreadexcel.pl]
http://cvs.namazu.org/namazu/contrib/spreadexcel.pl
2. 動作に必要なperlモジュールのインストール
2-1. ppmの設定
WebのアクセスにPROXYが必要な環境であれば、環境変数HTTP_PROXYにプロキ
シを指定します。
e.g.
C:\>set HTTP_PROXY=http://192.168.0.1:8080/
[参考: パッケージのインストール(PPMの使い方)@河馬屋二千年堂様]
http://member.nifty.ne.jp/hippo2000/perltips/ppm.htm
2-2. Spreadsheet::ParseExcelのインストール
ppmを起動し、Spreadsheet::ParseExcelをインストールします。install
コマンドを使えば必要なモジュールも全ていっしょにインストールされます。
e.g.
C:\>ppm
PPM>install Spreadsheet::ParseExcel
2-3. Jcodeのインストール
CPANからJcodeのtar ballをダウンロードし、適当なフォルダに展開します。
展開したフォルダにあるwin_install.plを実行します。
e.g.
C:\Jcode-0.82>perl win_install.pl
[CPAN Dan Kogai > Jcode-0.82]
http://search.cpan.org/author/DANKOGAI/Jcode-0.82/
3. インストールの確認
mknmzで設定を確認して、application/excelがあれば、インストールはたぶん
成功です。
e.g.
C:\namazu>mknmz -C
読み込んだ設定ファイル: C:/namazu/etc/namazu/mknmzrc /namazu/etc/namazu/mknmzrc
システム: MSWin32
Namazu: 2.0.7
Perl: 5.006001
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: chasen -j -F '%m '
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.SJIS
言語: ja_JP.SJIS
文字コード: sjis
CONFDIR: /namazu/etc/namazu
LIBDIR: E:/namazu/share/namazu/pl
FILTERDIR: E:/namazu/share/namazu/filter
TEMPLATEDIR: F:/pub/www/namazu/template
対応メディアタイプ:
application/excel
application/pdf
application/x-compress
application/x-gzip
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; x-type=rfc
text/x-hdml
--
Mineo Kasai <kasai@xxxxxxxxxxxxx>
ミ☆ NIS -NEC Informatec Systems ltd.-
TEL: 03-5427-2404 FAX: 03-5427-2406
# これでも使ってる人が現れなかったら、需要がないってことだな……。