Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

euc-jp encode/decode (was: win95,98 環境下での nmz205 使用時の文字化け)



From: Takashi Harada <harada@xxxxxxxxx> さん曰く
Subject: [namazu-win32-users-ja] Re:win95,98 環境下での  nmz205 使用時の文字化け
Message-ID: <4.3.1-J.20001206154336.00b26d90@xxxxxxxxxx>
Date: Wed, 06 Dec 2000 16:06:38 +0900

> encode(-Uオプションをはずす)すると、やはり“ファイルがみつからない”とサー 
> バーに
> 怒られます。“pnamazu”の方はerror_logをみるとencode部分が完全に
> おかしくなった内容で表示されていました。

From: Takashi Harada <harada@xxxxxxxxx> さん曰く
Subject: [namazu-win32-users-ja] win95,98 環境下での nmz205 使用時の文字化け
Message-ID: <4.3.1-J.20001206113618.00b5c2d0@xxxxxxxxxx>
Date: Wed, 06 Dec 2000 11:42:36 +0900

> 例:http://127.0.0.1/data/%A3%C9%A3%D42.doc
>   http://127.0.0.1/data/%C5%FA%BF%BD%BD%F1%A3%B2.ppt

例えば、
"%A3%C9%A3%D42.doc" は "IT2.doc"、
"%C5%FA%BF%BD%BD%F1%A3%B2.ppt" は "答申書2ppt"
をそれぞれ euc-jp で表現したときの 16進数を 2桁づつ %nn としたも
のそのままです。

ここから先は(自分が必要としないから)あまり詳しくないのですが、
http://host/data/%A3%C9%A3%D42.doc を browser からクリックしたと
きは、

host - - [06/Dec/2000:16:54:18 +0900] "GET /data/%A3%C9%A3%D42.doc HTTP/1.0" 404 157

な感じで encode したままの形で、httpd に要望を出し、"%nn" の部分
の解釈は httpd の server が行ないます。

例えば、私が立ち上げている UNIX 上 の apache に対して、WinNT の
NetScape や IE で上記のお願いを出すと、

Not Found
The requested URL /data/IT2.doc was not found on this server.
                        ~~~~ 

な感じで httpd が "%A3%C9%A3%D42.doc" = "IT2.doc" という変換を
してくれます。

## 上記のファイルは無いので error にはなりますが、存在すればなに
## かしら動くんじゃないかな。

> しばらくは-Uでいこうと思っておりますが、原因でもわかればもっとすっきりする? 
> でしょう・・。

Win 上で apache を立ち上げたことが無いので、原田さんと同一の環境
では試せませんが、疑うなら apache 側(の設定)であって namazu 側で
はないと思います。

harada> 怒られます。“pnamazu”の方はerror_logをみるとencode部分が完全に
harada> おかしくなった内容で表示されていました。

日本語Windows の apache って shift-jis 優先で動くのかしら。もし
そうなら、euc-jp を shift-jis と判断してしまっていそうですね。

IT2.doc
答申書2ppt

が付属の画像データの様に化けているのなら、おそらくそうでしょう。

P.S.
# 日本語のファイル名はいろいろと問題になるのであまり使って欲しく
# ないと思っていますが。。。特に私の目につく範囲では。。。
## と、会社の人間に言ってみたい。^^;;;

-- 
白井秀行@野首さん、ごめんなさい。(_ _)

Attachment: sjis.png
Description: PNG image