namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: pnamazu.cgi-98.10.01
Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx> wrote:
>perl 版検索クライアントを、別便にて高林さんに送ります。
トラブルにより遅くなってしまいました。
<URL:http://saturn.aichi-u.ac.jp/%7Eccsatoru/Namazu/contrib/pnamazu-98.10.01.tgz>
として置きました。展開すると
| gzip: stdin: decompression OK, trailing garbage ignored
と表示されるのでファイルがちょっとおかしいかもしれません。
>[*1]
>field 検索のときに、score が -1 になるのは、バグではなくて仕様です。
v1.3.0.0-beta の namazu はフィールド指定の検索のときはスコアを 1
に設定しています。重みづけの手がかりになるものがないので。
>[*2]
>データベースはバイナリファイルなので、下手にいじると、位置が変わって、
>おかしなことになります。
はい。すごく面倒です。
>それで、高林さんが、clnmz のようなツールを作っているわけですが、いろいろ
>なユーザの多様な要望に、高林さん一人で応えるわけにはいきませんし、もしや
>るとしても、いちいち専用のツールを作っていると大変です。ここで、
>
> (1) まずテキストに変換して
> (2) それを加工して
> (3) データベースを構築し直す
>
>という手順を踏むことにして、(1) と (3) が用意されていれば、(2) は、利用
>者が勝手に作ることができるようになります。
素晴らしい。この方式ならいろんなことができますね。
>また、これを使ったサンプルとして、v1.3.0 で導入された、インデックスの削
>除/更新による、無効なデータのゴミ掃除をするスクリプト gcnmz.pl というも
>のを作ってみました。
待っていました! 実は作るのが面倒だなと思っていたところです。これで
定期的にインデックスのゴミ掃除ができるようになりますね。
><注意> これを使ってみよう、という奇特な方へ!
> まだ作ったばかりで、実績が十分とは言えませんし、バグがあると、
> データベースが壊れかねない、危険な処理ですから、バックアップを
> とってから使うことをお勧めします。
> (いちおう、nmztxt.pl でも '.BAK' で元のを残すようにはしてあります)
> また、この他に、あると嬉しい機能などありましたら、お知らせ下さい。
私は全面的にテストに協力します :-)。
>[*3]
>jperl でない正規表現を使って日本語の正規表現検索をするのにあたり、今ま
>では
(snip)
>というシーケンスを (必要かどうかは不明ですが) 使えるようにしてみました。
うーん、趣味に走っていますね :-)。Perl の UTF-8 サポート (5.005_50
以降) が定着するとずいぶん話は変わってくるのでしょうけど。
-- Satoru Takabayashi