namazu-ml(ring)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
半生の韓なま
- From: sugiura@xxxxxxxxxxxx (Sugiura Shiro)
- Date: Sat, 29 Jan 2000 01:42:56 +0900 (JST)
すぎうらしろうです。
Namazu 1.9.13 をベースに、ちょっといじってハングルを検索するするよう
にしてみました。未完成なので自称"半生(はんなま)の韓なま(はんなま)"で
す。現在はとりあえずなんか動いているというレベルです。
[Base]
Date: Sat Jan 29 00:53:47 2000
Added Files: 1,087 files
Total Files: 1,087 files
Size: 3,333,756 bytes
Added Keywords: 46,049 words
Total Keywords: 46,049 words
Perl: 5.00503
Namazu: 1.9.13
System: freebsd
Wakati: cat
Time: 127 sec.
というファイル群から"あんにょんはせよ"を検索している風景はこちら↓
時間がたつとなくなっている可能性あり。
http://www.kt.rim.or.jp/~sugiura/han.gif
mknmzの結果を見ての通り、わかち書きに`cat`を使うという暴挙に出て
おり、韓国語表記でふつうに使われる"ティオッスギ(わかち書き)"に全
てを託しています。本当は助詞、助動詞、形容詞などの分離が必要なの
ですがそこまで韓国語をわかっていないので、これから韓国語入門を見
ながら手をつけるかつけないかどうしようかなという所です。
MIMEエンコードされた韓国語は検索できるのか?も未確認。
"半生(はんなま)の韓なま(はんなま)"の作り方
1: モジュールとか nkf とか kakasi の入っていないマシンを用意
入っていてもいいかも知れないけど、どういう影響がでるかが不明
2: ハングルの nkf 相当品をインストール。私は hcode を使った
3: おもむろに ./configure, make, su -, make install
4: PREFIX/share/namazu/pl/codeconv.pl の
my $nh = util::efopen("|$conf::NKF -emXZ1 > $nkftmp"); を
my $nh = util::efopen("|$conf::NKF > $nkftmp"); にしてみる
5: PREFIX/etc/namazu/mknmzrc を
--------------------------------------
$conf::NKF = "hcode ";
$conf::WAKATI = "cat ";
--------------------------------------
とかにしてみる。
7: 韓国語テキストを入手し、いつものように index を作る
8: 検索する
9; 結果が出る
10: ちょっと嬉しい
基本的に LANG は ja のままでやってます。
--
すぎうらしろう(Sugiura Shiro) E-mail : sugiura@xxxxxxxxxxxx
御希望の方に、もれなく less-332.tar.gz をプレゼントしています
[ If you want to talk with me, you MUST speak Japanese ]