Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Office 製品の文書に対する検索について。



 From: ken_kojima@xxxxxxxxxxxxxxxxxx
 Subject: [namazu-win32-users-ja] Re:Office 製品の文書に対する検索について。
 Date: Mon, 12 Nov 2001 10:24:05 +0900

 > その3 ただし、oleexcel.plのsub status()が、noを返すのではないか?
 > (  Excel XP だと、 Microsoft Excel 10.0 Object Libraryになってるのでは
 > ないかということで )

そうおもいます。Office XP は手近にありませんので確認できませんが、
http://www.microsoft.com/japan/developer/officedev/xp/word.asp と
かみたら、Microsoft Office 10.0 Object Library という文字列が見える
ので、たぶんそうなんでしょう。

とりあえず、Office XP の Word 文書をインデックスするとすれば、
C:\namazu\share\namazu\filter\win32\olemsword.pl を適当なエディタ
で編集すればいいんじゃないかな。具体的には、status() と 
ReadMSWord($$$) を以下のようにいじってみる。

sub status() {
    ...
    my $const;
    $const = Win32::OLE::Const->Load("Microsoft Word 10.0 Object Library");
    $const = Win32::OLE::Const->Load("Microsoft Word 9.0 Object Library")
        unless $const;
    $const = Win32::OLE::Const->Load("Microsoft Word 8.0 Object Library")
        unless $const;
    ...
}


sub ReadMSWord ($$$) {
    ...
    # Load Office 98 Constant
    local $office_consts;
    $office_consts = Win32::OLE::Const->Load("Microsoft Office 10.0 Object Library");
    $office_consts = Win32::OLE::Const->Load("Microsoft Office 9.0 Object Library") unless $office_consts;
    $office_consts = Win32::OLE::Const->Load("Microsoft Office 8.0 Object Library") unless $office_consts;
    ...
}

このように編集してみて、mknmz -C してメディアタイプに出てくるなら、
たぶん、インデックスもできるんじゃないかとおもいます。

これでうまくいくなら、oleexcel.pl と olepowerpoint.pl でも同様に試
してみるといいかもしれません。
--
馬場  肇 ( Hajime BABA )                  E-mail: hajime.baba@xxxxxxxxx
国立天文台 天文学データ解析計算センター
--