namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
 Re: Namazu v1.1.2.3 released! (Re: tknamazu 1.06	 release)
Takanori Hayashi <tzhaya@xxxxxxxxxxx> wrote:
>wgetで取得したファイルを、namazuで検索できるようにしているのですが、
>たとえば、http://www.hoge.go.jp/~boge/index.html なら
>チルダを %7E に変換して
>/data/www.hoge.go.jp/%7Eboge/index.html のようなディレクトリ名になります。
>
>これを mknmz にかけると、% が %25 に変換されるため
>検索結果のURLが
>/data/www.hoge.go.jp/%257Eboge/index.html
>のように表示されてしまいます。
うーん、そうですね。確かにそうなる仕様になっています。コマンドライ
ンから実行するとエンコードされた部分は自動的にデコードされるので問
題ないのですが、 CGIだとそのまま出力されるので困りますね。
>    $url =~ s/\%257E/%7E/g;  
このようにすると今度はコマンドラインから実行したときに %7E が自動
的にデコードされて
    /data/www.hoge.go.jp/~boge/index.html
のように表示されてしまうのがちょっと嫌な感じがします。とはいえ 
namazu -U で実行するとデコードを抑制できるので困らないかもしれませ
ん。
%7Eだけを特別扱いするのもちょっと気持ちが悪いので mknmz に 
    -U: URL の encodeをしない
というオプションをつけるのが良いような気がします (ちぐはぐな感じは
否めませんが)。もっとましな方法があれば教えてください。
--
高林 哲 Satoru Takabayashi