Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: namazu-2.0.12-mecab.patch
竹迫です。
> MeCab ML の未知語に対する扱いが ChaSen と異なるために検索結果が異な
>るだろう、とくどうさんが Mecab ML にて話されていましたが、experimental
>である理由はそこにあるという理解で良いでしょうか。
はい。その件も含めて、experimental である理由は以下の通りです。
(1) 未知語の処理が KAKASI と ChaSen と MeCab で異なる。
このままだと記号を絡む単語の検索精度が落ちる可能性がある。
(2) MeCab には、chasen -j に相当する(句点あるいは空行を文の区切り
として解析する)機能が存在しない。
(3) mecab-perl 0.7 以降から、マルチスレッドサポートが入ったため、
一部の環境で、安定性が pthread などの実装に依存する事がある。
(4) mknmz コマンドに --use-mecab オプションを追加する作業が未着手。
カタログファイルの翻訳も必要なため、次バージョンで対応予定。
(5) ./configure で、kakasi, chasen の他に mecab の自動検出を
行う作業が未着手。これも次バージョンで対応予定。
あと、ChaSen や KAKASI に比べると MeCab の認知度はまだ低いので、
Namazu で MeCab を使う場合の Know-How の蓄積が少ないことが挙げられます。
まだまだ不十分な点はあると思いますが、
個人的には、experimental という位置付けでも早めに公開して、
公開後に、いろいろと動作報告や改善要望などをいただいて、
今後の Namazu と MeCab の開発作業に繋げていければ良いかなと思っています。
> 基本的には良いと思います。experimental である理由が前述の通りなら、
>そのことも一応書いておいた方が良い気もします。
ありがとうございます。
情報を整理して、Namazu側でこれからやるべき事柄については、
TODO リストにも追加しておこうと思います。
--
株式会社ドリーム・アーツ
竹迫 良範 <takesako@xxxxxxxxxx>