Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: WordやExcelのファイル名の文字化け表示



寺西です。

SAIJI_Mitsuhiro wrote:
> 
> (1) 現象
>  日本語ファイル名のWordやExcelファイルをクライアント
> であるWindowsマシンのIE(ブラウザ)で検索し、
> 検索結果として表示されたWordやExcelのファイルのリンク表示をクリックして、
> そのファイルを開くと正常に表示されるが、「名前を付けて保存」しようとする
> と、
> ファイル一覧のダイアログで、ファイル名の欄に
> 今開いているファイルのファイル名が、文字化けして表示される。

どう文字化けするのでしょうか? 具体的にどういうファイル名がどう文字
化けするのか書いていただける方が状況を把握しやすいです。
(文字化けとは URIエンコードされたものになっているということで
しょうか、それとも完全に化けちゃっているのでしょうか?)

それはそうと、ファイルが Word や Excel で開ける以上、Word や Excel
で、「名前を付けて保存」時にファイル名が文字化けするのは、もはや
Word や Excel の問題のようにも見えます。

>  そのファイルのファイル名が半角英字の場合は、そのまま正常に表示される。
>  また、検索結果の画面では日本語ファイル名は正常に表示され、
> ファイルパスは正常にURIエンコードされて表示される。

ちなみに 文章.doc というファイルを IIS の root において、
IE から http://xxx.xxx.xxx/%95%b6%8f%91.doc とアクセスすると、
Word で 文章.doc ファイルを開くことができますが、
「名前を付けて保存」とすると、%95%b6%8f%91.doc というエンコード
されたままのファイル名になります。(そういう仕様のようです)

もし、文字化けがエンコードされたままだということが問題なのであれば、
mknmz 実行時に -U オプションを付けて、URI のエンコードを行わないよう
にすれば、うまくいくような気がします。
と、思いましたが UNIX では Shift_JIS のファイル名はうまく扱えない
かもしれません。

ところで。
 
> /usr/local/namazu/mytemplate/NMZ.body.jaに
>         <meta http-equiv="Content-Type" content="text/html; charset=x-sjis">
> の行を入れた。

今なら x-sjis の代わりに Shift_JIS が良いかもしれません。
# x-sjis しか認識しない古いブラウザがまだ現存する可能性はありますが。
 
> /etc/httpd/cgi-bin/.namazurcの設定
>         Lang ja_JP.SJIS
>         ContentType "text/html;charset=sjis-japan"

うーむ。sjis-japan って聞いたことがないのですが、正しいのでしょうか?
# IANA には登録されていないみたいですが...。(私が知らないだけかも)
 
> /etc/namazu/mknmzrcの設定
>         $KAKASI = "module_kakasi -isjis -osjis -w";

何故 sjis なのでしょう。Namazu は内部処理は EUC-JP で行いますので、
たとえ Shift_JIS で出力したいとしても、ここは euc でないといけない
筈です。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E