Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: WebDAVサーバの検索
- From: Yukio USUDA <m6694ha392t@xxxxxxxxxxxxxxx>
- Date: Mon, 29 Sep 2003 21:15:20 +0900
- X-ml-name: namazu-devel-ja
- X-mail-count: 03322
- References: <3F77E575.9B7FA4E2@asahi-net.or.jp>
臼田です
Tadamasa Teranishi wrote:
>
> と書きましたが、出力したい漢字コードと、ファイル名の漢字コードが
> 別ということもありえるし、区別できた方が何かと便利だと思い直し
> ました。
私も今のmknmzの中で言語と文字コードの区別がうまくできていないのが
気になっています。
(--index-langオプションがついてからは環境変数LANGに依存しなくなり
使いやすくなったのですが)
・表示メッセージの言語
・表示メッセージの文字コード
・ファイルシステムの文字コード
・インデックス対象となる文書ファイルの言語
・インデックスの文字コード
などは別々に管理してあげるとよいのだろうと思います。
> > 横道にそれますが、更に CAP でエンコードされたファイル名も
> > ここでデコードすると幸せになる人がいるかもしれませんね。
> > (これの指定方法はどうする? という話はありますが...。)
> ということも考えると Samba の codingsystem パラメータを .mknmz に
> 追加するというのが良いのかもしれません。
> (namazu-devel-ja#00574 で野首さんもちらっと言っている)
>
> とりあえずサポートするのは SJIS, EUC, HEX, CAP, UTF8 ぐらいで
> しょうか。(UTF8 は nkf202 以降か、Perl 5.8 以降に限定される
> でしょう。)
sambaでファイル共有しているフォルダの文字コードにCAPやHEXが使用
されていてもファイル名が読めるものにできると便利ですね。
> デフォルトは $mknmz::SYSTEM が "MSWin32" か "os2" の時は SJIS で
> それ以外は EUC として、必要に応じて書き換えてもらうということで、
> よろしいかと思います。
> ちなみに、
> ちょっと調べたところ、namazu-users-ja#00862 に CAP で困っている
> 人がいました。
> Samba がらみだと namazu-users-ja#00676 もこの関連の話で、こちらは
> テンプレートの修正についての話があります。
ファイル名での検索も考えるとnamazu側で表示のみ直すより
mknmz側で処理しておくほうが良いのでしょうね。
臼田幸生