namazu-dev(ring)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Using s/pat/subst/ in REPLACE
返事が遅くなってすみません
Junio Hamano <junio@xxxxxxxxxxx> wrote:
>濱野でございます。お誉めにあずかったので、[namazu-dev 100] と同
>じ内容のパッチを1.3.0.8 にバックポートしたものをお送りします。
ありがとうございます。 v1.3.0.9 に対するパッチの形で Webで公
開させていただきたいと思います。
# v1.3.0.9は v1.3.0.x シリーズ最後の版 (安定版) にしたいので
# 新機能は導入しづらいのです
>ときに、なまず、での字句の登録に関して質問があるのですが、
>「replace という字句はファイル re_match.c に現れる」という以上の
>情報、たとえば、「ファイル中の何行目に」(位置)とか、「関数定義
>として、あるいは、関数の呼び出しとして」(用法)とか言った属性も
>記録することが出来るような辞書構成になっているのでしょうか?
なっていません。もしそれを実現するなら、現在、単語に対して
「文書ID + スコア」を羅列する形式で NMZ.i に記録しているデー
タを「文書ID + 位置 + 用法」に変更する必要があります。 (位置
を記録すると NMZ.i のサイズはかなり大きくなるでしょう)
>なまずに現在する機能のなかでは、メールやニュースのフィールド検索
>の機能には、そういう属性記録があると一般的なメカニズムとして使え
>るな、と思ったのですが、ざっとコードを眺めた限りでは、フィールド
>検索にはそれ専用にアドホックな別辞書がつかわれているようですね。
そうです。フィールド検索は単なる行指向のテキストファイルで実
現されています。
>なんでこういうことに興味があるかというと、etags や ctags の出力
>を索引エンジンに食わせて(つまり、chasen や skk の代わりにこれら
>を tokenizer として使う、ということです)、なまずをソースコード
>ブラウザ(global とか lxr の類ね)としてつかえるのではないかな、
>と考えているからなのです。
うーん、難しいような…。
# あ、でも global が出力する HTMLに特化した検索システムは私
# も欲しいです
-- Satoru Takabayashi