Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: namazu-2.0.12-mecab.patch
竹迫です。
Perl 5.005_03 の our 宣言問題は、修正パッチを commit しました。
代わりに use vars を使用することにしました。
(参照: namazu-devel-ja#03067,03068)
>takesako@xxxxxxxxx wrote:
>>
>> 以前 mecabメーリングリストで話題になった namazu-2.0.12-mecab.patch
>> を commit しました。(HEAD, stable-2-0)
>...
>> とりあえず、experimental という位置付けで Namazu 2.0.13 で公開したい
>> と思います。
>
>experimental という位置付けでも公開するなら、ドキュメントの修正も
>しませんか? (まずは、必要最小限程度でも)
とりあえず最低限のドキュメントの修正として、以下を考えています。
問題がないようであれば、臼田さんの tutorial.html の修正も含めて、
明日の朝 commit する予定です。(stable-2-0 HEAD 両方とも)
cvs server: Diffing doc/ja
Index: doc/ja/tutorial.html
===================================================================
RCS file: /storage/cvsroot/namazu/doc/ja/tutorial.html,v
retrieving revision 1.44.4.10
diff -u -r1.44.4.10 tutorial.html
--- doc/ja/tutorial.html 11 Jul 2003 09:02:09 -0000 1.44.4.10
+++ doc/ja/tutorial.html 15 Jul 2003 08:59:38 -0000
@@ -189,13 +189,40 @@
<td>1.03</td><td><=</td><td>
<a href="http://www.daionet.gr.jp/~knok/chasen/Text-ChaSen-1.03.tar.gz">
Text-ChaSen-1.03.tar.gz</a></td>
- <td align=CENTER>
+ <td>
<a href="http://www.daionet.gr.jp/~knok/chasen/">
野首貴嗣</a></td>
<td><a href="http://www.daionet.gr.jp/~knok/chasen/">Text::ChaSen</a></td>
<td><br></td>
</tr>
+<tr>
+ <td><a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/">MeCab</a></td>
+ <td>(和布蕪) -- 日本語 形態素解析器</td>
+ <td>△</td>
+ <td>0.76</td><td>>= 0.6</td><td>
+ <a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/src/mecab-0.76.tar.gz">
+ mecab-0.76.tar.gz</a></td>
+ <td>
+ <a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/">
+ 工藤 拓</a></td>
+ <td><a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/src/">MeCab</a></td>
+ <td>※ experimental support</td>
+</tr>
+
+<tr>
+ <td><a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings.html">mecab-perl</a></td>
+ <td>MeCab Perl モジュール化</td>
+ <td>▲</td>
+ <td>0.76</td><td>>= 0.76</td><td>
+ <a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings/mecab-perl-0.76.tar.gz">
+ mecab-perl-0.76.tar.gz</a></td>
+ <td>
+ <a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings.html">
+ 工藤 拓</a></td>
+ <td><a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings/">MeCab</a></td>
+ <td>※ experimental support</td>
+</tr>
<tr><td>
<a href="http://search.cpan.org/search?mode=module&query=MMagic">File::MMagic</a>
@@ -220,9 +247,11 @@
<table cellspacing=0 cellpadding=3 border=1>
<tr><td>両方用意しておいた場合</td><td>
(無指定ではわかち書きに KAKASI を使うが、茶筌も
--c オプションをするだけで使用できる)</tr>
+-c オプションをするだけで使用できる)</td>
+</tr>
<tr><td>片方しか用意していない場合</td><td>
-./configure の時点でどちらを使うかが選ばれます。</tr>
+./configure の時点で KAKASI/ChaSen のどちらを使うかが選ばれます。</td>
+</tr>
</table>
<li>
@@ -234,6 +263,17 @@
インストールは <code>perl Makefile.PL; make; make install</code>
と実行するだけです。
問題がなければ入れておいた方がいいでしょう。
+
+<li>
+※ MeCabを使用する場合 (Namazu 2.0.13 から実験的にサポート)<br>
+現在は、mknmz の設定ファイル mknmzrc をカスタマイズして使用する必要があります。
+コマンドライン版の mecab を使用する場合は、
+$WAKATI = "mecab -O wakati";
+Perlモジュール版 MeCab を使用する場合は、
+$WAKATI = "module_mecab";
+と書く必要があります。
+ただし、MeCab は現在開発段階にあり、仕様そのものが不安定です。御了承ください。
+
<li>
namazu 2.0 以降では ChaSen2 にだけ対応しています。
@@ -732,6 +772,12 @@
<a href="http://chasen.aist-nara.ac.jp/">Chasen (茶筌)</a>
<dd>「日本語形態素解析器」であるが、KAKASIと同様に「わかち書き」
(正確には日本語の単語の切出し)に使っている。
+
+<dt>
+<a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/">MeCab (和布蕪)</a>
+<dd>MeCab は、ChaSenを基に開発された高速な形態素解析器です。
+現在 ChaSen とは独立に、工藤さんがフルスクラッチから開発しています。
+解析精度は ChaSen と変わらないにもかかわらず、ChaSen より高速に動作します。
<dt>わかち書き
<dd>
Index: doc/en/tutorial.html
===================================================================
RCS file: /storage/cvsroot/namazu/doc/en/tutorial.html,v
retrieving revision 1.9.4.9
diff -u -r1.9.4.9 tutorial.html
--- doc/en/tutorial.html 11 Jul 2003 09:02:08 -0000 1.9.4.9
+++ doc/en/tutorial.html 15 Jul 2003 08:59:35 -0000
@@ -199,6 +199,33 @@
<td><br></td>
</tr>
+<tr>
+ <td><a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/">MeCab</a></td>
+ <td>Yet Another Japanese Morphology Analyzer</td>
+ <td>for Japanese processing only. **</td>
+ <td>0.76</td><td>>= 0.6</td><td>
+ <a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/src/mecab-0.76.tar.gz">
+ mecab-0.76.tar.gz</a></td>
+ <td>
+ <a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/">
+ Taku Kudo</a></td>
+ <td><a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/src/">MeCab</a></td>
+ <td>*** experimental support</td>
+</tr>
+
+<tr>
+ <td><a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings.html">mecab-perl</a></td>
+ <td>MeCab Perl Module</td>
+ <td>for Japanese processing only. ++</td>
+ <td>0.76</td><td>>= 0.76</td><td>
+ <a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings/mecab-perl-0.76.tar.gz">
+ mecab-perl-0.76.tar.gz</a></td>
+ <td>
+ <a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings.html">
+ Taku Kudo</a></td>
+ <td><a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/bindings/">MeCab</a></td>
+ <td>*** experimental support</td>
+</tr>
<tr><td>
<a href="http://search.cpan.org/search?mode=module&query=MMagic">File::MMagic</a>
@@ -246,6 +273,15 @@
When executing ./configure, Namazu selects which one to use.</tr>
</table>
+<li>using MeCab (***), it supports experimentally above Namazu 2.0.13.<br>
+It is necessary to customize mknmzrc.
+If you want to use MeCab of command line version,
+write it as $WAKATI = "mecab -O wakati"; .
+And, if you want to use MeCab of Perl module version,
+write it as $WAKATI = "module_mecab"; .
+However, MeCab is in a development stage now
+and its specification is unstable.
+
<li>
Namazu 2.0x requires ChaSen 2.x.
The older version of ChaSen 1.x will not work with Namazu 2.0.x.
@@ -740,6 +776,12 @@
<dt>
<a href="http://chasen.aist-nara.ac.jp/">ChaSen</a>
<dd>Japanese morphological analyzer. Namazu uses this as a segmentation tool.
+
+<dt>
+<a href="http://cl.aist-nara.ac.jp/~taku-ku/software/mecab/">MeCab</a>
+<dd>MeCab is yet another part-of-speech and morphological analyzer which developed based on ChaSen.
+Mr. Kudo is developing from the full scratch, independently of ChaSen.
+Although analysis accuracy does not change with ChaSen, it operates at high-speed than ChaSen.
<dt>Segmentation
<dd>
--
株式会社ドリーム・アーツ
竹迫 良範 <takesako@xxxxxxxxxx>