namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: pnamazu.cgi-98.10.01



Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx> wrote:

>perl 版検索クライアントを、別便にて高林さんに送ります。

トラブルにより遅くなってしまいました。

<URL:http://saturn.aichi-u.ac.jp/%7Eccsatoru/Namazu/contrib/pnamazu-98.10.01.tgz>

として置きました。展開すると

| gzip: stdin: decompression OK, trailing garbage ignored

と表示されるのでファイルがちょっとおかしいかもしれません。


>[*1]
>field 検索のときに、score が -1 になるのは、バグではなくて仕様です。

v1.3.0.0-beta の namazu はフィールド指定の検索のときはスコアを 1 
に設定しています。重みづけの手がかりになるものがないので。


>[*2]
>データベースはバイナリファイルなので、下手にいじると、位置が変わって、
>おかしなことになります。

はい。すごく面倒です。


>それで、高林さんが、clnmz のようなツールを作っているわけですが、いろいろ
>なユーザの多様な要望に、高林さん一人で応えるわけにはいきませんし、もしや
>るとしても、いちいち専用のツールを作っていると大変です。ここで、
>
>    (1) まずテキストに変換して
>    (2) それを加工して
>    (3) データベースを構築し直す
>
>という手順を踏むことにして、(1) と (3) が用意されていれば、(2) は、利用
>者が勝手に作ることができるようになります。

素晴らしい。この方式ならいろんなことができますね。


>また、これを使ったサンプルとして、v1.3.0 で導入された、インデックスの削
>除/更新による、無効なデータのゴミ掃除をするスクリプト gcnmz.pl というも
>のを作ってみました。

待っていました! 実は作るのが面倒だなと思っていたところです。これで
定期的にインデックスのゴミ掃除ができるようになりますね。


><注意> これを使ってみよう、という奇特な方へ!
>        まだ作ったばかりで、実績が十分とは言えませんし、バグがあると、
>        データベースが壊れかねない、危険な処理ですから、バックアップを
>        とってから使うことをお勧めします。
>        (いちおう、nmztxt.pl でも '.BAK' で元のを残すようにはしてあります)
>        また、この他に、あると嬉しい機能などありましたら、お知らせ下さい。

私は全面的にテストに協力します :-)。


>[*3]
>jperl でない正規表現を使って日本語の正規表現検索をするのにあたり、今ま
>では

(snip)

>というシーケンスを (必要かどうかは不明ですが) 使えるようにしてみました。

うーん、趣味に走っていますね :-)。Perl の UTF-8 サポート (5.005_50
以降) が定着するとずいぶん話は変わってくるのでしょうけど。

-- Satoru Takabayashi