Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Namazu 2.0.13 による一太郎インデックスの作成
- From: 村井 俊文 <murai.t-fs@xxxxxxxxx>
- Date: Fri, 07 May 2004 22:43:12 +0900
- X-ml-name: namazu-win32-users-ja
- X-mail-count: 02171
村井と申します。
Namazu 2.0.13 for Win32 ( β版) 付属のフィルタにより
一太郎ファイルのインデックス化を行ってみましたが、私の
環境(Win2000 SP4)では正しく作成されませんでしたので
ご報告します。
(以下に一太郎12で作成した文書について検索画面の例を
あげます。)
なお、Namazu 2.0.12 の時も namazu 付属のフィルタを使用
して Win2000 上で一太郎ファイルのインデックス化はうまく
出来ませんでした。
○ namazu 付属のフィルタで作成した場合
-----------------------------------------------------------
参考ヒット数: [ y: 1 ]
検索式にマッチする 1 個の文書が見つかりました。
1. 坊っちゃん.jtd (スコア: 7)
著者: 不明
日付: Sun, 25 Apr 2004 15:44:27
ミマ 爍ア * > ty tyyy yyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyy
yyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyyy
yyyyyyyyyyyyyyyyyyyy
file://127.0.0.1/test2/坊っちゃん.jtd (13,824 bytes)
現在のリスト: 1 - 1
ペイジ: [1]
-----------------------------------------------------------
○ jt.pl でインデックスを作成した場合
以下は以前 小嶋様より投稿のありました jt.pl
(v 1.7.0 2002/12/06 )を使用して作成したもので、
インデックスが正しく作成されています。
\namazu\share\namazu\filter\ の中の taro.pl taro56.pl
taro7_10.pl を削除し jt.pl を入れて実行したものです。
-----------------------------------------------------------
参考ヒット数: [ 無鉄砲: 1 ]
検索式にマッチする 1 個の文書が見つかりました。
1. 坊っちゃん.jtd (スコア: 6)
著者: x
日付: Sun, 25 Apr 2004 15:44:27
親譲りの無鉄砲で小供の時から損ばかりしている。小学校に居る
時分学校の二階から飛び降りて一週間ほど腰を抜かした事がある。
なぜそんな無闇をしたと聞く人があるかも知れぬ。別段深い理由で
もない。新築の二階
file://127.0.0.1/test2/坊っちゃん.jtd (13,824 bytes)
現在のリスト: 1 - 1
ペイジ: [1]
-----------------------------------------------------------
なお、通常私は一太郎用フィルタとして jt.pl
(v 1.3.1 2002/03/06) を元に
my $para =Win32::OLE::Enum->new($jdoc->GetString);
の部分を、
my $para =Win32::OLE::Enum->new($jdoc->GetString(2));
に変更したものを使用しています。
(罫線のあるファイルの文字を全て検索対象とするため。この辺
のいきさつは過去ログを参照下さい。)
何故 jt.pl v 1.3.1 を使用しているかと言えば、それは以下の
理由によります。
・大量のファイルを処理する上で、途中で Out of memory で
終了するのを避けるため、チェックポイントを動作させるオプション
( -s )を付加してインデックスを作成。
(例えば mknmz -s -U -O c:\index c:\xxxx )
・この場合 jt.pl v 1.3.1 であれば、途中で「一太郎 起動数の
上限に達しました。確認 ヘルプ」のボックスが出て停止しまう
事が無い。
jt.pl v 1.3.1 は1文書毎に一太郎の起動停止を行うようで、
それによりこのような結果になると思われます。開発された小嶋様の
意図に沿わない使い方で申し訳なく思っております。
インストールされている一太郎のバージョンは12です。
動作環境
CPU Pentium4 2.80CGHz
メモリ 2GB
OS Windows 2000 Professional SP4
Namazu 2.0.13
Perl 5.6.1.638
xpdf version 3.00
Office 2000 Professional
一太郎12
インデックス対象
ワード、エクセル、PPT、PDF、一太郎、TXT、HTML
最高 約46,000件(うち一太郎ファイル約7,600件)
///////////////////////////////////////////////////
村井 俊文 E-mail:murai.t-fs@xxxxxxxxx