Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

win95,98 環境下での nmz205 使用時の文字化け



原田です。
先日、#00438で阿久津さんが文字化けの件を投稿されていたので
気になり、試して見ました。(インデックス作成までは自分で確認できていたので)
長い文章になってしまいますが、ご容赦頂きたく・・・
Win95、Win98SEにてテスト(別途namazu+pnamazuも使っているので関係上)

Perl5.6.0.620-win32、perl500503(Api522.exeを使用)
nkf3217
kakasi-2.3.2
xpdf-0.91-win32-ms、xpdf-0_90-win32
namazu:nmz205exe、zip
以上の4タイプの組み合わせで実行
namazu.cgi.exe+.namazurc+apache1.3.9でブラウザie5.5で閲覧

−−−−−nmz205+Perl506の時のmknmzでのlog----
57/61 - /c|/Apache/qms/data/%CA%A1%B8%AB%BC%D2%B0%F7.PDF [application/pdf]
58/61 - /c|/Apache/qms/data/%CA%BF%C0%AE11%C7%AF%C5%D9%20%B6%E5%BD%A3%C3%CF%B6%E
8%B8%EC [application/msword]
60/61 - /c|/Apache/qms/data/%CC%DA%B8%B6%BC%E7%C7%A4.PDF [application/pdf]

インデックスを書き出しています...
[基本]
日付: Tue Dec 5 11:11:10 2000
追加された文書の数: 61
サイズ (bytes): 5,235,293
合計の文書数: 61
追加キーワード数: 5,597
合計キーワード数: 5,597
わかち書き: module_kakasi -ieuc -oeuc -w
経過時間 (秒): 132
ファイル/秒: 0.46
システム: MSWin32
Perl: 5.006
Namazu: 2.0.5 (このlogはwin98seで、xpdf-0.91を使用時のものです)
ー-----ここまでlog------
結果として、上記のどの組み合わせの時も同じ様な文字化け現象が発生。
尚、mknmzrcとnamazurc(.namazurc)の設定は4回とも同じ設定

対象文書:doc、ppt、xls、pdfの拡張子を持つ文書でファイル名が半角英数・文字
と日本語名のファイルが混在しているものをテスト、全文書インデックス作成はOK

1.サマリはきれいに出来ているし、文字化けせずに検索ヒット時に表示する
2.原本のファイルが半角英文字(数字)だったらOK
3.pdf変換ファイルも当然上記に同じ

キーワードを入力して、抽出、件数、スコア表示等はOKです。
リプレース表示も表面上は正しい様に見えるが、文字化けしている為
サーバー側では当然"ファイルがみつからない”というエラーになる。
例:http://127.0.0.1/data/%A3%C9%A3%D42.doc
  http://127.0.0.1/data/%C5%FA%BF%BD%BD%F1%A3%B2.ppt
  http://127.0.0.1/data/%A3%C9%A3%D42.PDF
どうもnamazuに起因していそうですが、上記の組み合わせで
ファイル名が日本語の場合で問題なく動作している環境の方が
おられたら、対策方法等ご教授願えれば有りがたいです。

T.Harada<harada@xxxxxxxxx>