Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
複数桁数字のインデックス化
- From: naoto.katsuki@xxxxxxxxxxxxx
- Date: Wed, 27 Nov 2002 09:42:47 +0900
- X-ml-name: namazu-users-ja
- X-mail-count: 02928
かつきと申します。
初めて参加させていただきます。
漢字(2バイト)、英単語(1バイト)はインデックス化できるのですが、数字(1
バイト)がインデックス化できません。
現象としては”1234”のような複数桁の数字です。
主に.pdfや.txtファイルを読み込みます。
1ファイルの中身が(<--A)
"漢字","123"のような場合は、"漢字"のみインデックス化できています。"123"はイ
ンデックス化できていません。
しかし、
1ファイルの中身が(<--B)
"ABC","123"のような場合は、"ABC","123"をインデックス化できています。
上記Aの場合に数字をインデックス化できず困っております。
環境は以下のとおりです。
文字コード等に問題があるのでしょうか。
皆様のお力をいただければ幸いに存じます。
$namazu -v
namazu of Namazu 2.0.10
$ chasen -V
ChaSen version 2.2.9 (c) 1996-2001 Nara Institute of Science and Technology
Grammar files are in ChaSen's new v-gram format.
$ mknmz -C
読み込んだ設定ファイル: /usr/local/etc/namazu/mknmzrc
システム: linux
Namazu: 2.0.10
Perl: 5.006
NKF: /bin/nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: /usr/local/bin/chasen -j -F '%m '
わかち書き: /usr/local/bin/chasen -j -F '%m '
メッセージの言語: ja_JP.eucJP
言語: ja_JP.eucJP
文字コード: euc
CONFDIR: /usr/local/etc/namazu
LIBDIR: /usr/local/share/namazu/pl
FILTERDIR: /usr/local/share/namazu/filter
TEMPLATEDIR: /usr/local/share/namazu/template
対応メディアタイプ:
application/excel
application/ichitaro6
application/msword
application/pdf
application/powerpoint
application/x-bzip2
application/x-compress
application/x-gzip
application/x-js-taro
application/x-rpm
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; x-type=rfc
text/x-hdml
text/x-roff
------------------------------
Katsuki Naoto
mailto:naoto.katsuki@xxxxxxxxxxxxx
------------------------------