Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: phrase search



knok@xxxxxxxxxxxxx (NOKUBI Takatsugu) wrote:

>  しかし、phrase search 的に使う分には困らないですけど、いろいろ応用し
>ようとした時には encoding が壁になりそうですね... 論理的な文字数を位置
>に返す、という感じでいいのかな?

たしかに。エンコーディングの問題は考えていませんでした。文書
のエンコーディングを記録しておく必要がありますね。


># FreeWAIS は byte 数を返して、それで encoding 自動変換との絡みで問題
># があったような記憶が...

byte数でいいんじゃないでしょうか。EUC-JP, Shift_JIS, UTF-8 
は OK ですよね。ISO-2022-JPは行頭まで戻らないと状態がわから
ないのが難点です。

-- Satoru Takabayashi