Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: xdoc2txtが処理できないファイル「No such file or directory」



中原です。お世話になっております。

花井様、素早いご回答ありがとうございました。

こちらでもエラーファイルを含む小規模インデックスで確認した後
実際の環境でインデックス作成を行い、正常に作成されているこ
とを確認することができました。

NMZ.errファイルを確認したところ、9件「Unable to convert file」
メッセージを確認しました。内訳をお知らせします。

1-6件目 : wordファイル、内容は意味不明な文字列
7件目 : 拡張子なし、内容は意味不明な文字列
8-9件目 : pdfファイル、AcrobatReaderで開くと「修復中」メッセー
ジが出たあと正常に開くことができます。

以下に作成時の情報をお知らせします。お役にたてますと幸いです。

<NMZ.log>
[Base]
Date:                Wed Oct 22 02:29:54 2003
Added Documents:     22,075
Size (bytes):        3,762,873,394
Total Documents:     22,075
Added Keywords:      1,040,656
Total Keywords:      1,040,656
Wakati:              module_kakasi -ieuc -oeuc -w
Time (sec):          125,391
File/Sec:            0.18
System:              MSWin32
Perl:                5.006001
Namazu:              2.0.12

<その他>
indexサイズ: 79.6MB
*現時点では検索は1〜2秒程度で終了します。

<環境>

OS:Windows2000Server SP4(Celeron500Mhz,128MBメモリ)

C:\>namazu -C
読み込んだ設定ファイル: C:\namazu\etc\namazu\namazurc
--
インデックス (Index):    C:\index
ログの記録 (Logging):    on
使用する言語 (Lang):     ja_JP.SJIS
スコア計算 (Scoring):    tfidf
テンプレート (Template):
ヒット件数の上限 (MaxHit):      10000
マッチする語の上限 (MaxMatch):  1000
強調タグ (EmphasisTags): <strong class="keyword">       </strong>
置換 (Replace): /f\|/                   file:///\\\\lyr5f-kl/knowledge/

C:\>mknmz -C
読み込んだ設定ファイル: C:/namazu/etc/namazu/mknmzrc
システム: MSWin32
Namazu: 2.0.12
Perl: 5.006001
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: chasen -j -F '%m '
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.SJIS
言語: ja_JP.SJIS
文字コード: sjis
CONFDIR: C:/namazu/etc/namazu
LIBDIR: C:/namazu/share/namazu/pl
FILTERDIR: C:/namazu/share/namazu/filter
TEMPLATEDIR: C:/namazu/share/namazu/template
対応メディアタイプ:
  application/excel
  application/ichitaro4
  application/ichitaro5
  application/ichitaro6
  application/ichitaro7
  application/msword
  application/pdf
  application/powerpoint
  application/rtf
  application/x-gzip
  application/x-js-taro
  message/news
  message/rfc822
  text/hnf
  text/html
  text/html; x-type=mhonarc
  text/plain
  text/plain; x-type=rfc
  text/x-hdml

> 下記の修正をmsword2.plに行ってみてください。
>
> [いただいた訂正内容]
> system("$wordconvpath -e -f $tmpfile2");
> の後に,以下を追加
> unless (-e $tmpfile) {
>     unlink $tmpfile2;
>     return 'Unable to convert file';
> }
>
> 当方では、いまのところ(エラーファイルを含む小規模な対象でのインデックスで
は)
> うまく動いております。
>
> 複数の方から同様の要望(不具合修正)がありましたので、web上のmsword2.plの方
も、
> 出来るだけ早めに修正したいと思います。
> (それにあたり、中原さんの(変更後の)結果をご報告頂けると幸いです。)