Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: mknmzで文書ファイルから英単語リストの作成は可能か
長部です。
On Sun, 09 Mar 2003 01:33:12 +0900
Tadamasa Teranishi <yw3t-trns@xxxxxxxxxxxxxxx> wrote:
> 寺西です。
>
> 私、単語の取り出しに mknmz を使ったことはあります。手軽にそれなり
> のものが得られるので。
> その時は、きちんとしたものである必要はなかったし、得られた NMZ.w を
> ベースに手を加えるつもりでしたら、十分目的は果たせました。
>
> mknmz の count_words() の中の
>
> # Normalize into small letter.
> $$contref =~ tr/A-Z/a-z/;
>
> の行をコメントアウトすれば、大文字・小文字は保たれると思います。
情報ありがとうございます。
他の方のメールでもある通り、mknmzの出力だと、ノイズが多くなるので、
リファレンスマニュアルから、クラス名、メソッド名等を抽出する
スクリプトプログラムを自作してみます。