namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: "HTML tidy" for OS/2 and japanese page
はじめまして、くどうたくです。
京都大学の言語メディア研(旧長尾研)に在籍(B4) しており、Juman 3.6 の開発に
たずさわっております。(Windows 版作成と Perl Module について..)
> >> 1. Windows版の作成
> >> 2. Perlモジュール(Juman.pm)の作成
> >> 3. 連語処理のbug fix
>
> とあります。僕はまだ見てませんししばらく見ているヒマもないので紹介
> だけでナンなのですが、しばらく前に ChaSen Perl モジュールの話もあ
> りましたことですし、あるいは2が興味深いかもしれません。
この Perl Module は、Juman を Server Mode で動かしたときに Juman プロトコル
を使って Juman Client としてつなげるための Module です。だから standalone
で使ってもあんまり意味ないとおもいます。研究室で複数から利用するという
形態では、こういう module のほうが使いやすいので...
あと、ここで話題になったか知らないですけど、高速な形態素解析のツールとしては
Sumomo があります。Juman の 5倍程度のスピードで解析してくれます。
現在 Chasen と Juman は ソース的にはほとんど同じなので、(パト木を使ってるetc)
Chasen よりもずいぶん高速だと思います。
ただし、Juman と同じく EDR 辞書を使ってるんで、商用には使えなかったはずです。
http://www.brl.ntt.co.jp/sumomo/
また、拙作ですが Sumomo を Client/Server 対応にするための Patch が
http://flos.kuee.kyoto-u.ac.jp/soft/sumomo-1.3-cs.patch
にあります。
----
くどうたく taku@xxxxxxxxxxxxxxxxxxxxxxx