namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: "HTML tidy" for OS/2 and japanese page



はじめまして、くどうたくです。

京都大学の言語メディア研(旧長尾研)に在籍(B4) しており、Juman 3.6 の開発に
たずさわっております。(Windows 版作成と Perl Module について..)

 > >> 	1. Windows版の作成
 > >> 	2. Perlモジュール(Juman.pm)の作成
 > >> 	3. 連語処理のbug fix
 > 
 > とあります。僕はまだ見てませんししばらく見ているヒマもないので紹介
 > だけでナンなのですが、しばらく前に ChaSen Perl モジュールの話もあ
 > りましたことですし、あるいは2が興味深いかもしれません。

この Perl Module は、Juman を Server Mode で動かしたときに Juman プロトコル
を使って Juman Client としてつなげるための Module です。だから standalone
で使ってもあんまり意味ないとおもいます。研究室で複数から利用するという
形態では、こういう module のほうが使いやすいので...

あと、ここで話題になったか知らないですけど、高速な形態素解析のツールとしては
Sumomo があります。Juman の 5倍程度のスピードで解析してくれます。
現在 Chasen と Juman は ソース的にはほとんど同じなので、(パト木を使ってるetc)
Chasen よりもずいぶん高速だと思います。
ただし、Juman と同じく EDR 辞書を使ってるんで、商用には使えなかったはずです。

http://www.brl.ntt.co.jp/sumomo/

また、拙作ですが Sumomo を Client/Server 対応にするための Patch が
http://flos.kuee.kyoto-u.ac.jp/soft/sumomo-1.3-cs.patch

にあります。

----
くどうたく taku@xxxxxxxxxxxxxxxxxxxxxxx