Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
samba で作成したファイル名の拡張子が欠ける
- From: Dai Nakamura <hu_nakamura@xxxxxxxxxxxxxxx>
- Date: Wed, 13 Jun 2001 17:16:36 +0900
- X-ml-name: namazu-users-ja
- X-mail-count: 01767
はじめまして。中村ともうします。
sambaサーバーのドキュメントをnamazuで全文検索したいと考え
ています。
サーバー:RedHat Linux6.2
クライアント:Windows 98/NT/2000
なまず:namazu:2.0.5
文書フィルタ:xlHtml-0.2.8
lv4.4.9.4
wv-0.6.5
WEBサーバー:apache1.3.12
samba:2.0.7
上記ソフトを全て導入し、sambaサーバーにてWindowsクライアント
から、MS-Excel/Wordの文書を書き落としました。
その後、namazuにてindexを作成し、namazu.cgiを介してブラウザ
より検索が可能な状態になっております。
URIは、.namazurcのなかで、
Replace /home/httpd/html/sambaroot/ file:////hostname/docroot/
などと指定し、ブラウザの検索結果から直接ファイルを引用できる
ようにしております。
ところが、一部の日本語ファイルで、拡張子(Excelなら.xls、Word
なら.doc)が欠けて、Winクライアントよりファイル引用出来ない
ものが出てきております。
例えば、「漢字.doc」なるファイルを作成し、その文書が検索結果に
表示されると、
文書名「漢字.do」
URI「file:////hostname/docroot/漢字.do」
などとなり、ファイルを引用できません。
もちろん、「.do」はmimeタイプにも登録してませんのでアプリケー
ションの起動などもできません。
この現象は、ファイル名が英数字だと発生せず、また、日本語でも
起こるものとそうでないものがあるようです。
この現象の発端は、namazuの検索結果のURIが、SJIS/EUCのコード違い
のためURIの日本語部分の文字列が
file:////hostname/doc/%90V%82%B5%82%A2%83t%83H%83%8B%83_/aaa.xls
などのようにコードで出力したため、mknmzのコマンドオプション-Uを
使用してそれを回避しようとしたため起こったようです。
-Uオプションを使用しない場合、コード標記のままですと、正確にファイル
を引用可能です。
ただ、人間の目で見るとファイル名もその所在(フォルダ名)も判らない
ため、日本語で標記したく思っています。
このような現象(もしくは目的)に対する対処法をご存知の方がおられま
したら、ご教授いただきたく思っております。
--
_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/
中村 大
mailto:hu_nakamura@xxxxxxxxxxxxxxx
_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/_/