Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: ole $B%*%W%7%g%s(B
白井です。
# ちょっと気になる。:-)
From: U86128@xxxxxxxxxxxxxxxxx <U86128@xxxxxxxxxxxxxxxxx> さん曰く
Subject: [namazu-win32-users-ja] Re: ole オプション
Message-ID: <200003061852091091.223@xxxxxxxxxxxxxxxxx>
Date: Mon, 6 Mar 2000 18:52:08 +0900
上口> $ALLOW_FILE = ".*\\.(?:$HTML_SUFFIX)|.*\\.txt" .
上口> "|.*\\.pdf|.*\\.doc|.*\\.xls" .
上口> "|.*\\.ppt" .
これって、/namazu/etc/mknmzrc (~/.mknmzrc あるいは -I file) を上
記のように書き換えたということでしょうか?
$ALLOW_FILE = ".*\\.(?:$HTML_SUFFIX)|.*\\.txt" .
"|.*\\.pdf|.*\\.doc|.*\\.xls" .
"|.*\\.ppt";
だとどうですか。
# もし、上口さんのかかれたままだと Perl の代入文になっていないの
# で。。。試したのですが、エラーにはならないで、default 設定を使
# うようです。
もし、私の推測が正しければ、
From: kenzo-@xxxxxxxxxx (Ken-ichi Hirose) さん曰く
Subject: [namazu-win32-users-ja] Re: ole オプション
Message-ID: <199712311634.BAA03595@xxxxxxxxxxxxxxxxxxxxx>
Date: Thu, 1 Jan 1998 01:34:45 +0900 (JST)
広瀬> <U86128@xxxxxxxxxxxxxxxxx> wrote.
広瀬> /~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
広瀬> >と改め、検索対象ファイルには word,xls,powerpoint,pdf と4ファイルを用意して
広瀬> >mknmz -a -O e:\www\index . を実行しましたが
広瀬> >4個のファイルがインデックス作成の対象として見つかりました
広瀬> >1/4 - /E|/www/Trip/test_ppt.ppt 未対応の形式 (application/msword)無視します
広瀬> >1/3 - /E|/www/Trip/test_word.doc 未対応の形式 (application/msword)無視します
広瀬> >1/2 - /E|/www/Trip/test_xls.xls 未対応の形式 (application/powerpoint)無視します
広瀬> >1/1 - /E|/www/Trip/text_pdf.pdf 未対応の形式 (application/pdf)無視します
こちらは、--ole(-o) option が無いから、pdf 以外の挙動は納得でき
ます。pdf が無視されるのは
上口> さっそく xpdf-0.90-win32 より pdftotext を追加し
pdftotext.exe に path が通っていないということは無いでしょうか?
広瀬> >同環境を用いて、
広瀬> >mknmz -o -O e:\kamiguch\www\index . を実行しますと
広瀬> >2個のファイルがインデックス作成の対象として見つかりました
広瀬> >Use of uninitialized value at C:/namazu/share/namazu/filter/gfilter.pl line 67.
広瀬> >Use of uninitialized value at C:/namazu/share/namazu/filter/gfilter.pl line 70.
広瀬> >1/2 - /E|/www/Trip/test_word.doc [application/msword]
広瀬> >2/2 - /E|/www/Trip/text_pdf.pdf 未対応の形式 (application/pdf)無視します
広瀬>
広瀬> -a と -o の組合せで動作が変わるという事ですね?
こちらは、きっと '--all --ole' と二つ書けば大丈夫なのではないで
しょうか。
# ただし、私の環境では excel と powertpoint は Win32::OLE がエラー
# しまくるので動作しませんけど。。。
# File-MMagic が MS-Office の file type を誤判別するしね。
# MS の作る file の Magic Number って 100% 判定するのは無理なん
# じゃないかなぁ、と思っています。Win32::OLE のときは、気持悪い
# けど '拡張子' で判別なのかなぁ。
--
白井秀行 (mailto:shirai@xxxxxxxxxxxxxxxxxxx)