Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: 日本語のディレクトリー名とファイル名で困っています ( 自己解決)
こんにちは、作山@日本総研です。
>
>発生している現象
> wgetで収集したファイル名がshift-jisで保存される
> 為に、うまくmknmzできなかったり、Link先に
> Jumpできなかったりしている。
> (ディレクトリー名は %8Edなどのようにエンコード
> された状態で保存されているがファイル名が英字の
> 場合は、正常にJumpできる。)
とりあえず(私自身は嫌いな言葉なのですが)、何とかする事ができました。
以下のような形で正常にLink先へJumpできるように
インデックス作成が出来るようになりました。
根本原因
wgetがShift-JIS(カナ・漢字)のファイル名がShift-JISのまま
Solaris内に記録されてしまう。
解決策
私の力では、wgetのソースまでは手を出し切れないので、
wgetで取得後、ファイル名にカナ漢字が含まれているものに
ついて、%xxのエンコード後のファイル名にRenameする
perlを作成し、個々のファイル名をRenameするように
しました。
結果、namazuの検索結果上では、エンコードした%xxの
表示で見苦しいが、正常にLink先にJumpできるように
なりました。
以上、よろしくお願いします。
______________________________________________________________________
作山@日本総研 (Office) mailto:sakuyama.akio@xxxxxxxxx
TEL 03(5431)7839 (Home) mailto:sakuyama@xxxxxxxxxxxxxxxxxx
FAX 03(3422)1745 JWNTUG:JWNTUG001739