トップ » gonzui » gonzui 0.3 公開

2005年1月29日

gonzui 0.3 公開

gonzui 0.3 を公開しました。検索機能の充実が今回の主な変更点です。
  • 複数のキーワードを指定して検索できるようにした (例: malloc free)
  • フレーズを検索できるようにした(例: "return if")
  • マルチバイト文字を検索できるようにした (例: 日本語)
  • コメントと文字列内を検索できるようにした
  • 言語を指定した検索をできるようにした (Cだけを対処にする、など)
  • テキストファイルを検索できるようにした

細かい修正点は他にもたくさんあります。データベースに格納するデータが大幅に増えたため、gonzui-import にかかる時間も増えました。性能の改善に徐々に取り組んでいく予定です。

マルチバイト文字の検索は今のところ unigram という非常に安直な方法をとっています。茶筌やMeCabなどを用いた単語分割は行いません。たとえば ruby-1.8.2.tar.gz を取り込んで「オブジェクト サイズ」で検索すると このような検索結果が得られます。ただのテキストファイルをまとめて突っ込んでも同様の検索ができますが、 gonzui-import はかなり遅いのが難点です。

開発者用のメーリングリストを sourceforge.jp に作りました。興味のある方は参加していただければと思います。

 
投稿者 satoru | このエントリーを含むはてなブックマーク