Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

日本語ファイル名の検索について (namazu-bugs-ja#199)



Full_Name: Yoh Sakano
Version: 2.0.10
OS: Vine Linux 2.1.5
Submission from: (NULL) (61.206.148.51)


はじめまして。
タイムインターメディアのの坂野と申します。

何度かnamazuを利用させていただいております。
さて、今回は日本語ファイル名の検索をしようとしていて、
バグらしきものを発見しましたのでご報告します。

<現象1>

インデックス作成の際、日本語ファイル名が分かち書きされる場合と、されない場合がある。
ファイルの内容に日本語が存在する場合は、日本語ファイル名も分かち書きされ、
ファイルの内容に日本語が存在しない場合は、日本語ファイル名は分かち書きされない模様。

以下、"ファイル名.txt"
というファイルをインデクシングした場合に作成されるNMZ.wです。

# ファイルの内容に日本語が存在する場合 ( ファイルの内容は "テスト" )

$ cat NMZ.w
.txt
txt
テスト
ファイル
名

# ファイルの内容に日本語が存在しない場合( ファイルの内容は "test" )

$ cat NMZ.w
test
txt
ファイル名
ファイル名.txt

<現象2>

"+uri:ファイル名" 等の検索式を使って、日本語ファイル名のフィールド検索ができない。

フィールド検索用のインデックスがURLエンコードされているから?

$ cat NMZ.field.uri
/tmp/index/../test2/%A5%D5%A5%A1%A5%A4%A5%EB%CC%BE.txt

<環境>

Perl: jperl5.005_03-20000401
mknmz: mknmz of Namazu 2.0.10
OS: Linux 2.2.18-0vl4.2 ( Vine Linux 2.1.5 )