Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
一太郎11用 filter について
- From: ken_kojima@xxxxxxxxxxxxxxxxxx
- Date: Thu, 7 Mar 2002 14:17:17 +0900
- X-ml-name: namazu-win32-users-ja
- X-mail-count: 01294
小嶋@青森です。
以下に、一太郎11フィルタを投稿します。長文ご容赦下さい。
これで、Perlだけの環境で使えます。さらに、今回は一太郎4〜6の文書も対象
にしてます。
以前の版では、読み込み時に確認用のダイアログが出て処理が中断すること
がよくありましたが、これは押さえ込めたと思います。
現状での問題は、一太郎が文書を読み込む毎に、ウインドウのフォーカスが
フィルタ用の一太郎に移ることです。何か作業をしている時には、極めて邪魔
です。
なお、このフィルタは、Namazu2.0.10 ActivePerl Build631でテストしています。
----------------------<jt.pl>-------------------------------
#
# -*- Perl -*-
# $Id: jt.pl,v 1.3.1 2002/03/06 11:55:35 D.K.C $
#
# Rubyのスクリプトは必要なくなりました。
# 一太郎ver4,5,6も対象に追加。
# タイトル、ファイル名の文字化け対策追加。
# ダイアログ表示による停止を回避。
#
package jt;
use strict;
use File::Copy;
use NKF;
use Win32::OLE;
use Win32::OLE::Enum;
use Win32::OLE::Const;
require 'util.pl';
require 'gfilter.pl';
sub mediatype() {
return ('application/ichitaro4', 'application/ichitaro5', 'application/ichitaro6',
'application/x-js-taro'
);
}
# olemsword.pl より引用 ただし一太郎12については、後で確認のこと
sub status() {
open (SAVEERR,">&STDERR");
open (STDERR,">nul");
my $const;
$const = Win32::OLE::Const->Load("TARO 12.0 Type Library");
$const = Win32::OLE::Const->Load("TARO 11.0 Type Library")
unless $const;
open (STDERR,">&SAVEERR");
return 'yes' if (defined $const);
return 'no';
}
# ここまで
sub recursive() {
return 0;
}
sub pre_codeconv() {
return 0;
}
sub post_codeconv () {
return 0;
}
sub add_magic ($) {
my ($magic) = @_;
$magic->addFileExts('(?i)\\.jsw', 'application/ichitaro4');
$magic->addFileExts('(?i)\\.jaw', 'application/ichitaro5');
$magic->addFileExts('(?i)\\.jbw', 'application/ichitaro6');
# Ichitaro 8, 9, 10, 11
$magic->addFileExts('\\.jt[dt]$', 'application/x-js-taro');
return;
}
sub filter ($$$$$) {
my ($orig_cfile, $cont, $weighted_str, $headings, $fields)
= @_;
my ($tline,$aline,$dline,$sentence);
my ($line,@DocProperty,$i,$key,$val,$title,$author,$date);
my ($DocInfo,$jdoc,$unit,$jxw,$japply,$taroobj);
my $cfile = defined $orig_cfile ? $$orig_cfile : '';
$$cont = "";
my $jfile = $cfile;
$jfile =~ s/\//\\/g;
#ここから、ole使用の部分
$jxw = Win32::OLE->new('JXW.Application') or die "Oops, cannot start Ichitaro.";
$jxw->{'WindowState'} = 2;
$japply = $jxw->Application;
$taroobj = $japply->TaroLibrary;
$jxw->Documents->Open($jfile); #参照モード読み込み
$DocInfo = Win32::OLE::Enum->new($taroobj->GetDocumentInformation);
for ($i=1;$i<=17;$i++){
$unit = Win32::OLE::Enum->new($DocInfo->Next);
($key,$val) = $unit->All();
$DocProperty[$i][1] = $key;
$DocProperty[$i][2] = $val;
}
$tline = $DocProperty[6][2];
$tline = $DocProperty[1][2] unless $tline;
$aline = $DocProperty[8][2];
$aline = $DocProperty[3][2] unless $aline;
$dline = $DocProperty[9][2];
my $maxsheetnum = $taroobj->GetSheetCount;
my $sheetcount=0;
while($sheetcount < $maxsheetnum){
$jdoc = $japply->TaroLibrary;
$jdoc->ChangeCurrentSheet(eval(++$sheetcount));
my $CurrentSheetItem = Win32::OLE::Enum->new($jdoc->GetCurrentSheetItem);
my @SheetItem = $CurrentSheetItem->All();
my $sheettype = $SheetItem[0];
my $sheetname = $SheetItem[1];
if ($sheettype == 10 ){
# print "\nシート".$sheetcount.":".$sheetname."は一太郎文書ではありません。\n";
# この項、動作試験用としてのみ。単体でfilterとして用いる場合、オプションを使えないため。
# Rubyのスクリプトでは、オプションでこのメッセージの出力を制御したが、ここでは常時出力しないこととする。
} else {
# print "\nシート".$sheetcount.":";
# print $sheetname."\n";
# 同上。常時出力せず。ただし、シート名をインデックスするのもありかも。
$jdoc->JumpStart;
until($jdoc->OutOfDocument){
$jdoc->SelectRangeStart(30);
my $para =Win32::OLE::Enum->new($jdoc->GetString);
my @ary = $para->All();
foreach $line (@ary){
$sentence .= $line;
}
}
}
}
$taroobj->QuitDocumentWindow;
$jxw->Quit;
# ここまで,OLE関係部分
$fields->{'title'} = nkf('-eSZ',$tline)
if (defined $tline);
$fields->{'author'} = nkf('-eSZ',$aline)
if (defined $aline);
$$cont .= nkf('-eSZ',$sentence);
gfilter::line_adjust_filter($cont);
gfilter::line_adjust_filter($weighted_str);
gfilter::white_space_adjust_filter($cont);
$fields->{'title'} = gfilter::filename_to_title($cfile, $weighted_str)
unless $fields->{'title'};
gfilter::show_filter_debug_info($cont, $weighted_str,
$fields, $headings);
return undef;
}
1;