namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Plan for Namazu next version



高林です

Ken-ichi Hirose <hirose@xxxxxxxxxxxxxxxxxxxx> wrote:

>お返事が遅くなって申し訳ないです。
>#業務に忙殺されて ^^;

いえいえ、とんでもないです。

# 私も学校の情報処理センター向けに「Perl で簡単な会計処理をしよう」
# みたいな原稿を書かないといけなくて大変だったりします。今更断れな
# いし…。


>#あっちこっちいじってました。^^;
>#できてるなんて言って混乱させてしまい申し訳ないです _o_

私のコードは ChaSen for Win を対象としているので、その辺がまずかっ
たですね。これからはディフルト KAKASI にしたいと思います。



>>1. command.com の copy を使う (パスの区切りが \ なのでちょっと嫌)
>>2. cp.exe を Win32 用に C で書いてしまう ( / でパスを区切るやつ)
>>3. UNIX/Win32 ともに Perl でコピーする (効率はどうなんでしょう?)
>>
>>という選択肢が考えられます。 2. と 3. だと mknmz.pl のコードは 
>>UNIX と共通でいけますね。どうしましょう > 広瀬さん。
>
>やっぱり 2. 3. どちらかがいいですね
># perl5 では「これだ!」と言うのは無かったですが 。。。

この際、 nkf も使うのをやめて jcode.pl とかで処理してしまえば、 
Win32 と UNIX でコードの一元化が計れますね。 Win32 で問題となるの
は open 時に nkf をパイプで通す部分のおかしな動作ですので。 Win32 
専用のコードはこれで完全に払拭できると思います。

あと、 KAKASI/ChaSen の代わりに日本語わかち書き処理を Perl で行っ
てしまうというのも面白そうですね。できれば N-best 法を実装したいと
ころです。ついでに検索ツールも Perl で用意すれば、完全に Perl だけ
で動作するようになります。

# このアイディアは以前に古川@ヤマハさんから伺ったものです。

--
高林 哲 Satoru Takabayashi