Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

xdoc2txtが処理できないファイル「No such file or directory」



はじめまして。中原といいます。

メーリングリストにはいつもお世話になっております。初めて投稿させていた
だきます。無作法などございましたらご指摘いただけますと幸いです。

文書フィルタ(word,excel,powerpoint)にxdoc2txtを使ってnamazuを試用して
います。(詳しい環境については文末をご覧下さい。)

インデックス作成中(mknmz -sU)に以下のようなエラーが出て停止して
しまいました。

mknmz: < c:/index/h15_04/NMZ.word.tmp.txt: No such file or directory

DOS画面上の表示とNMZ.flist.tmpより停止時に処理中だった.docファイル
を見つけ、コマンドライン上でxdoc2txtの動作を確認したところ、Windows
のアプリケーションエラーを表示して停止してしまいました。(ファイルの中
身は意味不明な文字列でした)

本来xdoc2txtの作成者様にお知らせするべき内容と思われますが、暫定
での対処方法を探しています。

おそらくmsword2.plの106行目周辺にNMZ.word.tmp.txtが生成されたかの
判定と生成されない場合の処理(とばす)を追記すればよいのでは、と推
測しています。(外していたら申し訳ないです。もっといい方法もあるので
しょうか。)

私にperlの経験が全くないので、自分で勉強するか、友人に頼むかしよう
と考えているのですが、時間を要してしまいそうです。もしご意見、対処方
法などご教示いただけるようでしたら大変助かります。よろしくお願い致し
ます。

<msword2.pl>104〜110行目

    system("$wordconvpath -e -f $tmpfile2");

    {
        my $fh = util::efopen("< $tmpfile");
        #my $fh = util::efopen("< $tmpfile");
        $$cont = util::readfile($fh);
    }

以下現在の環境についてお知らせします。

OS:Windows2000Server SP4(Celeron500Mhz,128MBメモリ)

C:\>namazu -C
読み込んだ設定ファイル: C:\namazu\etc\namazu\namazurc
--
インデックス (Index):    C:\index
ログの記録 (Logging):    on
使用する言語 (Lang):     ja_JP.SJIS
スコア計算 (Scoring):    tfidf
テンプレート (Template):
ヒット件数の上限 (MaxHit):      10000
マッチする語の上限 (MaxMatch):  1000
強調タグ (EmphasisTags): <strong class="keyword">       </strong>
置換 (Replace): /f\|/                   file:///\\\\lyr5f-kl/knowledge/

C:\>mknmz -C
読み込んだ設定ファイル: C:/namazu/etc/namazu/mknmzrc
システム: MSWin32
Namazu: 2.0.12
Perl: 5.006001
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: chasen -j -F '%m '
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.SJIS
言語: ja_JP.SJIS
文字コード: sjis
CONFDIR: C:/namazu/etc/namazu
LIBDIR: C:/namazu/share/namazu/pl
FILTERDIR: C:/namazu/share/namazu/filter
TEMPLATEDIR: C:/namazu/share/namazu/template
対応メディアタイプ:
  application/excel
  application/ichitaro4
  application/ichitaro5
  application/ichitaro6
  application/ichitaro7
  application/msword
  application/pdf
  application/powerpoint
  application/rtf
  application/x-gzip
  application/x-js-taro
  message/news
  message/rfc822
  text/hnf
  text/html
  text/html; x-type=mhonarc
  text/plain
  text/plain; x-type=rfc
  text/x-hdml