Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: namazu-2.0.12-mecab.patch



竹迫です。

>  MeCab ML の未知語に対する扱いが ChaSen と異なるために検索結果が異な
>るだろう、とくどうさんが Mecab ML にて話されていましたが、experimental 
>である理由はそこにあるという理解で良いでしょうか。

はい。その件も含めて、experimental である理由は以下の通りです。

(1) 未知語の処理が KAKASI と ChaSen と MeCab で異なる。
    このままだと記号を絡む単語の検索精度が落ちる可能性がある。
(2) MeCab には、chasen -j に相当する(句点あるいは空行を文の区切り
    として解析する)機能が存在しない。
(3) mecab-perl 0.7 以降から、マルチスレッドサポートが入ったため、
    一部の環境で、安定性が pthread などの実装に依存する事がある。
(4) mknmz コマンドに --use-mecab オプションを追加する作業が未着手。
    カタログファイルの翻訳も必要なため、次バージョンで対応予定。
(5) ./configure で、kakasi, chasen の他に mecab の自動検出を
    行う作業が未着手。これも次バージョンで対応予定。

あと、ChaSen や KAKASI に比べると MeCab の認知度はまだ低いので、
Namazu で MeCab を使う場合の Know-How の蓄積が少ないことが挙げられます。

まだまだ不十分な点はあると思いますが、
個人的には、experimental という位置付けでも早めに公開して、
公開後に、いろいろと動作報告や改善要望などをいただいて、
今後の Namazu と MeCab の開発作業に繋げていければ良いかなと思っています。

>  基本的には良いと思います。experimental である理由が前述の通りなら、
>そのことも一応書いておいた方が良い気もします。

ありがとうございます。

情報を整理して、Namazu側でこれからやるべき事柄については、
TODO リストにも追加しておこうと思います。

--
  株式会社ドリーム・アーツ
    竹迫 良範  <takesako@xxxxxxxxxx>