Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: WordやExcelのファイル名の文字化け表示
寺西です。
SAIJI_Mitsuhiro wrote:
>
> /common1/docs/というフォルダに「文書.doc」をいれて、
> http://xxx.xxx.xxx.xxx/common1/docs/%95%b6%8f%91.doc
> にアクセスしても、
> HTTP 404 - ファイル未検出
> Internet Explorer
> がでます。
それでは、ファイル名が SJIS になっていないでしょう。
> そこで、「文書.doc」のインデックスを作成すると、
> URIエンコードの結果は
> http://xxx.xxx.xxx.xxx/common1/docs/%CA%B8%BD%F1.doc
> となり、
「文書」の EUC コードは CAB8 BDF1 です。つまりファイル名は EUC
コードになっているということですね。
そうであれば、EUC コードのファイル名のものを Word なり
Excel なりで開いても、名前を付けて保存する際に Shift_JIS に
変換して表示したりはどうやってもできないでしょう。
(Word や Excel にそんな機能はないはず)
名前を付けて保存する際に文字化けせずに表示するには、
ファイル名が Shift_JIS でなければならないはずです。
(Unicode も可能かもしれません。)
ここまでは、Namazu と全く関係のない話です。では、ファイル名を
Shift_JIS にすれば Namazu も期待したとおりに動くかというと、
> もし、文字化けがエンコードされたままだということが問題なので
> あれば、mknmz 実行時に -U オプションを付けて、URI のエンコードを
> 行わないようにすれば、うまくいくような気がします。
> と、思いましたが UNIX では Shift_JIS のファイル名はうまく扱えない
> かもしれません。
という話があって、Namazu では UNIX 版は Shift_JIS のファイル名は
うまく扱えないという別の話があります。
(正確には UNIX 版はファイル名は EUC-JP であることが前提で、
Win32 版はそれを Shift_JIS であることが前提に変更したわけですが。)
つまり、今のところ期待した動作をする環境を作るには、Web サーバを
Windows 系のものに変えて、Win32 版 Namazu を使うと可能かもしれません。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E