Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
wakati-gaki fails わかち書きのインデックスがうまく作成されない
- From: KITA Toshihiro <t-kita@xxxxxxxxxxxxxxxxxxxxxxxxxx>
- Date: Mon, 23 Apr 2001 22:43:36 +0900
- X-ml-name: namazu-users-ja
- X-mail-count: 01692
初めまして。喜多@熊本大学と申します。
Namazu には大変お世話になっております。
いま,Plamo Linux 2.1 で mknmz を動かそうとして,
壁につきあたっています。アドバイスをお願いいたします。
例えば,
2001年度 電気電子工学実験第一 班分け表
という文字列をを含んだ html ファイルを検索対象にすると
NMZ.w には
2001年度 電気電子工学実験第一 班分け表
のようにそのままの形でインデックスとなって登録されてしまいます。
しかし,
# kakasi -w
2001年度 電気電子工学実験第一 班分け表
2001 年度 電気電子 工学実験 第一 班 分け 表
なので,kakasi は正常に動いているようです。
NMZ.log を見ると
[Base]
Date: Mon Apr 23 22:17:07 2001
Added Documents: 55
Size (bytes): 142,365
Total Documents: 55
Added Keywords: 5,701
Total Keywords: 5,701
Wakati: /usr/local/bin/kakasi -ieuc -oeuc -w
Time (sec): 5
File/Sec: 11.00
System: linux
Perl: 5.00502
Namazu: 2.0.5
なので,問題なさそうに見えるのですが...
NMZ.w の中は
---------------------------------------------------------------
パソコン側webブラウザ
パソコン側からはURL呼び出し。
ファイルから作り直す時は
ファイルの形式はワープロ,画像,プレゼンテーションファイルなど,なんでも結構です
。
ファイルも含めて)にして下さい。
ファイルを含めて
ファイルを置いて,アクセスを学内限定にする。
---------------------------------------------------------------
のような感じなので,他の単語もわかち書きがうまく行かないようです。
mknmz のオプションをいろいろと変えたり,
kakasi の辞書を直接 $KAKASI に指定したりしたのですが,
やはりダメでした。
Plamo のパッケージの設定がおかしいのかと思い,
pkgtool で namazu を uninstall して,
namazu-2.0.5.tar.gz ソースから make してインストールしましたが,
やはり状況は変わりません。
別のマシン(Vine Linux 2.1) 上では
正常にわかち書きされて NMZ.w が作成されます。
チェックすべき点など御教示ください。よろしくお願いします。
----------
〒860-8555 熊本大学 工 電気システム 助手 喜多敏博
(KITA Toshihiro, tel,fax: 096-342-3613)
t-kita@xxxxxxxxxxxxxxxxxxxxx
Web page : http://www.eecs.kumamoto-u.ac.jp/~t-kita/