Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [RFC]${uri}の拡張



寺西です。

Kenji Suzuki wrote:
> 
> > ちなみに複数の漢字コードのファイル名が混在するケースとして、
> > どういった場合を考えられているのでしょうか?
> 
> ひとつは、特定の目的で特定のディレクトリ以下は別の漢字コード
> にしている場合です。例としては、EUCな Linuxサーバ上だが、一部は
> DAV用に UTF-8 にしている、という場合が考えられます。

このケースに関しては想定している範囲になりますね。

この場合は、インデックスを分けて作ってもらうか、
ディレクトリごとに漢字コードを指定できれば対応可能ですね。
(後者は HEAD で対応かな)

たぶん指定するディレクトリも2つぐらい、多くても数個程度で
しょうから、何十個も指定しなくてはならないといったことも
ないでしょう。
 
> もうひとつは、リモートで作成されたインデックスの場合です。
> 複数のウェブ・サーバがあり、それぞれ OS が異なっていて、
> 漢字コードが違う状況だが、まとめて検索を提供したいという場合が
> 考えられます。

こちらは特殊なケースと考えられます。ただ、特殊だとはいえ、これに
ついてはできるようになっているのが望ましいですね。

基本的にはインデックスごとに漢字コードが指定できれば大丈夫では
ないかと思います。
おそらく検索はまとめて行うが、インデックスは各 Web サーバで作る
ことになるでしょうから。(ひとつのインデックスにまとめることは
ないでしょうし)

ということで、最低限 インデックスごとに漢字コードが指定できれば、
インデックスを分けることで対応可能。かといって、非常に多くの
インデックスに分ける必要まではとりあえずなさそう。
ということになります。どうやら十分実用的な範囲になりそうです。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E