Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
日本語ファイル名の検索について (namazu-bugs-ja#199)
- From: sakano@xxxxxxxxxxxxx
- Date: Tue, 21 May 2002 14:36:37 +0900 (JST)
- X-ml-name: namazu-devel-ja
- X-mail-count: 02565
Full_Name: Yoh Sakano
Version: 2.0.10
OS: Vine Linux 2.1.5
Submission from: (NULL) (61.206.148.51)
はじめまして。
タイムインターメディアのの坂野と申します。
何度かnamazuを利用させていただいております。
さて、今回は日本語ファイル名の検索をしようとしていて、
バグらしきものを発見しましたのでご報告します。
<現象1>
インデックス作成の際、日本語ファイル名が分かち書きされる場合と、されない場合がある。
ファイルの内容に日本語が存在する場合は、日本語ファイル名も分かち書きされ、
ファイルの内容に日本語が存在しない場合は、日本語ファイル名は分かち書きされない模様。
以下、"ファイル名.txt"
というファイルをインデクシングした場合に作成されるNMZ.wです。
# ファイルの内容に日本語が存在する場合 ( ファイルの内容は "テスト" )
$ cat NMZ.w
.txt
txt
テスト
ファイル
名
# ファイルの内容に日本語が存在しない場合( ファイルの内容は "test" )
$ cat NMZ.w
test
txt
ファイル名
ファイル名.txt
<現象2>
"+uri:ファイル名" 等の検索式を使って、日本語ファイル名のフィールド検索ができない。
フィールド検索用のインデックスがURLエンコードされているから?
$ cat NMZ.field.uri
/tmp/index/../test2/%A5%D5%A5%A1%A5%A4%A5%EB%CC%BE.txt
<環境>
Perl: jperl5.005_03-20000401
mknmz: mknmz of Namazu 2.0.10
OS: Linux 2.2.18-0vl4.2 ( Vine Linux 2.1.5 )