knok@xxxxxxxxxxxxx (NOKUBI Takatsugu) wrote: > しかし、phrase search 的に使う分には困らないですけど、いろいろ応用し >ようとした時には encoding が壁になりそうですね... 論理的な文字数を位置 >に返す、という感じでいいのかな? たしかに。エンコーディングの問題は考えていませんでした。文書 のエンコーディングを記録しておく必要がありますね。 ># FreeWAIS は byte 数を返して、それで encoding 自動変換との絡みで問題 ># があったような記憶が... byte数でいいんじゃないでしょうか。EUC-JP, Shift_JIS, UTF-8 は OK ですよね。ISO-2022-JPは行頭まで戻らないと状態がわから ないのが難点です。 -- Satoru Takabayashi