Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: filename検索他修正
- From: Yukio USUDA <usuda@xxxxxxxxxx>
- Date: Wed, 10 Mar 2004 13:04:35 +0900
- X-ml-name: namazu-devel-ja
- X-mail-count: 03808
- References: <404E5123.29287FAD@asahi-net.or.jp>
臼田です。
Tadamasa Teranishi wrote:
> > > ・filename を検索対象に含めるように修正
> > > (安全のためディレクトリ名は含めていません。)
> > > $SEARCH_FIELD に filename を追加すると、フィールド検索も可能ですし、
> > > filename による検索結果のソートも可能です。
> > > --
> > file名の検索問題はここで正規化して解決させるということですね
>
> uri の方がまだまだ長引きそうだし、filename 検索が必要ならこうする
> のがかなり有効かなと思いました。
では、uri問題はじっくり取り組みましょう。
> というのも filename.pl とかが意外に人気だということをつい最近知った
> もので。(filename.pl の代わりになるものではありませんが。)
ファイル検索にもNamazuを使うというニーズがあるのであれば、
DENY_FILEに対してはファイル読み込みやフィルタ処理はせずに
ファイル名や日付だけfieldに情報を残すという
オプションでもつけましょうか。
(だいぶ改造しないといけないように思えますが、file名だけ残すために
ファイル読み込みをするのは少しもったいないですし)
> > これは、complete_field_info()内に持っていきませんか
>
> complete_field_info() の前に行っている処理と、その後に行っている
> 処理があるため、持っていけないという事情があります。
>
$filenameを本文に追加したいからということですね
complete_field_info後の
$content .= " $filename ";
を
$content .= " $fields{'$filename'} ";
にすればよいのでは
> > gfilter::filename_to_titleを使っていないですが
> > filename_to_titleに問題があるのでしょうか?
>
> $weighted_str の処理がいらないのと、何やら加工しているのが気味悪い
> (意味不明)ので避けました。
> # nkf 2.04 なら UTF-8 にも対応できますし。
>
これもわかります。
> と書くと filename_to_title の手直しが必要だということを意味している
> わけですが、filename_to_title の手直しをすると影響が大きそうなので、
> 2.0.13 リリースのことを考え手を出していません。
> --
STABLEに入れる分は今回のスタイルにしておき、
HEADではfilename_to_tiltleも直しましょう。
まず、各フィルタ内でfilename_to_tiltleを呼び出しているのは無駄
なので削ってしまえばよいです。
フィルタ内で呼び出さなくても結局complete_filed_infoで処理されます。
(utf8index-branchでは削ってみました。)
complete_field_info()で何をすべきかを整理していけば影響なく自然に
手直しできると思います。
filename_to_title内で$weighted_strを触っているのは妙なので
その部分はcomplete_field_infoに出してきましょう。
さらに$fields{'title'}も
先に作った$fields{'filename'} を使うことにすれば
filename_to_titleそのものが不要になるのかも?
臼田幸生