namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Namazu v1.1.2.3 released! (Re: tknamazu 1.06 release)



Takanori Hayashi <tzhaya@xxxxxxxxxxx> wrote:

>wgetで取得したファイルを、namazuで検索できるようにしているのですが、
>たとえば、http://www.hoge.go.jp/~boge/index.html なら
>チルダを %7E に変換して
>/data/www.hoge.go.jp/%7Eboge/index.html のようなディレクトリ名になります。
>
>これを mknmz にかけると、% が %25 に変換されるため
>検索結果のURLが
>/data/www.hoge.go.jp/%257Eboge/index.html
>のように表示されてしまいます。

うーん、そうですね。確かにそうなる仕様になっています。コマンドライ
ンから実行するとエンコードされた部分は自動的にデコードされるので問
題ないのですが、 CGIだとそのまま出力されるので困りますね。


>    $url =~ s/\%257E/%7E/g;  

このようにすると今度はコマンドラインから実行したときに %7E が自動
的にデコードされて

    /data/www.hoge.go.jp/~boge/index.html

のように表示されてしまうのがちょっと嫌な感じがします。とはいえ 
namazu -U で実行するとデコードを抑制できるので困らないかもしれませ
ん。

%7Eだけを特別扱いするのもちょっと気持ちが悪いので mknmz に 

    -U: URL の encodeをしない

というオプションをつけるのが良いような気がします (ちぐはぐな感じは
否めませんが)。もっとましな方法があれば教えてください。

--
高林 哲 Satoru Takabayashi