Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: ヒットのしかたが変では
> 千葉市中央区長洲
> 藤原 誠
> (3) (検索)NMZ.w の中を見ると、変に長い文字列が見えたりしませんか
nishi> かなり長い文章とかあるようです。
nishi> しかし長い文章は"‖"とか"|"で区切られてリストされています。
nishi> これは別の意味があるのでしょうか。
「長い文章がある」というのはわかち書きがうまく動いていない
(うまく動かなかったことがある)ということで、それでは思うように
検索することは出来ません。
|| (?上の縦棒二本は何 (*)) のようなものは特に深い意味はないと
思いますが、正直 「区切られれてリストする」という意味が僕には
分りません。さしさわりのない範囲で例をそのまま記入していただい
た方が状況が良く伝わるのですが。
それで、
1. kakasi を入直す
2. mknmz を入直す
3. 設定を見直す
4. 初めから索引を作り直す
などをした方がいいと思います。
その前に mknmz --help で日本語にはなりますよね ?
mknmz -C で
わかち書き: module_kakasi -ieuc -oeuc -w
のような字は表示されますか。
あるいは (僕は少し表示を変更しているので
setenv LANG C
した後の表示で言うと) 次のような文字は見えますか ?
KAKASI: module_kakasi -ieuc -oeuc -w
ChaSen: module_chasen -j -F '%m '
Wakati: module_kakasi -ieuc -oeuc -w
それらに問題がないとすると、
それでまずは 4. だと思います。
「NMZ.* を消して、もう一度 mknmz をして見る」でしょうか。
それでも NMZ.w に単語以上の並びがあったらおかしいです。
その時には 1,2 などかなと思います。
> perl -MText::Kakasi -e ''
> と入力すると何も表示されないのが正しいのですが、そうなりますか。
nishi> とりあえず何も表示されませんでした。perlの入れなおし等も行なって
nishi> おりません。正しく動いているということでしょうか。
正しく動いているという意味にはなりません。少なくとも
「Kakasi の Perl 部品は入っていて、Perl から利用出来る」と
いうことが確認出来て、問題は他のところにありそうだと分るだ
けです。
nishi> ちなみに .mknmzrc の設定ファイルの最後の方の、
nishi> # Softwares for handling a Japanese text
nishi> という行以下はwebで検索するだけなら#(コメント)を外す必要はない
nishi> のですよね。kakasiに関する行もあったのでちょっと心配になりました。
どのような場合でもそのままで構いません。それらの変数をどう
しても変更したい強い理由がある時にだけ設定(修正)します。
(*) 二つの文字の 16 進表現
euc-japan sjis
‖ a1 c2 81 61
| a1 c3 81 62
---
(藤原)