Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Word2000のファイルがインデックスされない。



古川と申します。

以下の、システムでWord2000のファイルをインデックス使用としたところ、
次のメッセージが出てインデックスできませんでした。

@@ Processing ms-word file ... (using  '/usr/local/bin/wvHtml')
// load_document 実行後: /home/furu/test.doc: 71680, 71680, 0, application/mswor
d; x-error=未対応の形式: unknown
1/1 - /home/furu/test.doc 未対応の形式: unknown

msword.plを調べた結果、
127行目で確認しているWordファイルのバージョン情報が、128行目のif文とマッチしないことが
原因であると思われます。

最後に示すパッチにより、if文を修正すると正常にインデックスされますの、でこのままで問題は
無いと思いますが、お手数ですが識者の方確認願います。

<システム>
OS:FreeBSD 5.1-RELEASE
Namazu:2.0.12
perl : 5.6.1
nkf : 2.0.2
Kakasi : 2.3.4 
wvWare : 0.7.6
lv : 4495

<127行目で取得されたバージョン情報>
Version: word8 or higher, Encrypted: No

<パッチ>
--- msword.pl.org	Tue Sep 30 11:27:22 2003
+++ msword.pl	Tue Sep 30 11:27:37 2003
@@ -128,7 +128,7 @@
 	my $supported = undef;
 	my $fh_cmd = util::efopen("$wvversionpath $tmpfile |");
 	while (<$fh_cmd>) {
-	    if (/^Version: (word\d+),/i) {
+	    if (/^Version: (word\d+)/i) {
 		$version = $1;
 		#
 		# Only word8 format is supported for Japanese.

以上です。

---------------------------------------------
 古川 剛啓
 三菱重工業(株) 名古屋航空宇宙システム製作所
 航空機技術部 地上統合システム課 ASE
 TEL:052-611-2126      FAX:052-611-2259
 E-mail :y-furukawa@xxxxxxxxxxxx (Office)
---------------------------------------------