Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: filename検索他修正



臼田です。

Tadamasa Teranishi wrote:

> > > ・filename を検索対象に含めるように修正
> > >   (安全のためディレクトリ名は含めていません。)
> > >  $SEARCH_FIELD に filename を追加すると、フィールド検索も可能ですし、
> > >  filename による検索結果のソートも可能です。
> > > --
> > file名の検索問題はここで正規化して解決させるということですね
> 
> uri の方がまだまだ長引きそうだし、filename 検索が必要ならこうする
> のがかなり有効かなと思いました。
では、uri問題はじっくり取り組みましょう。

> というのも filename.pl とかが意外に人気だということをつい最近知った
> もので。(filename.pl の代わりになるものではありませんが。)
ファイル検索にもNamazuを使うというニーズがあるのであれば、
DENY_FILEに対してはファイル読み込みやフィルタ処理はせずに
ファイル名や日付だけfieldに情報を残すという
オプションでもつけましょうか。
(だいぶ改造しないといけないように思えますが、file名だけ残すために
ファイル読み込みをするのは少しもったいないですし)

> > これは、complete_field_info()内に持っていきませんか
> 
> complete_field_info() の前に行っている処理と、その後に行っている
> 処理があるため、持っていけないという事情があります。
> 
$filenameを本文に追加したいからということですね

complete_field_info後の
 $content .= " $filename ";
を
 $content .= " $fields{'$filename'} ";
にすればよいのでは

> > gfilter::filename_to_titleを使っていないですが
> > filename_to_titleに問題があるのでしょうか?
> 
> $weighted_str の処理がいらないのと、何やら加工しているのが気味悪い
> (意味不明)ので避けました。
> # nkf 2.04 なら UTF-8 にも対応できますし。
> 
これもわかります。

> と書くと filename_to_title の手直しが必要だということを意味している
> わけですが、filename_to_title の手直しをすると影響が大きそうなので、
> 2.0.13 リリースのことを考え手を出していません。
> -- 
STABLEに入れる分は今回のスタイルにしておき、
HEADではfilename_to_tiltleも直しましょう。

まず、各フィルタ内でfilename_to_tiltleを呼び出しているのは無駄
なので削ってしまえばよいです。
フィルタ内で呼び出さなくても結局complete_filed_infoで処理されます。
(utf8index-branchでは削ってみました。)

complete_field_info()で何をすべきかを整理していけば影響なく自然に
手直しできると思います。

filename_to_title内で$weighted_strを触っているのは妙なので
その部分はcomplete_field_infoに出してきましょう。

さらに$fields{'title'}も
先に作った$fields{'filename'} を使うことにすれば
filename_to_titleそのものが不要になるのかも?

臼田幸生