Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Unicode(UTF-8) は使えない?



単純な疑問を持ったのですが、教えてください。
(文字のことはよくわかっていませんので頓珍漢なことを聞いている
かもしれません。)

>>>>> In [namazu-users-ja : No.02756] 
>>>>> Noriki Okada <MLC08520@xxxxxxxxx> wrote:
> 別に他言語でページを書きたいわけではなく、単にShift-JISに
> 文字がないのでUnicode(UTF-8)を使おうとしているだけです。

SHIFT-JIS にない文字はどうやって入力しているのですか?
&#x263c; &#x263d; のように入力しています?

「IMEで入力できるのかなあ」と単純に思ったんです。

>>>>> In [namazu-users-ja : No.02757] 
>>>>> “廣瀬” = HIROSE Yoshihide <yoshihide@xxxxxxxxxx> wrote:
廣瀬> 残念ですが、使えません。mknmzで文字コード変換に使っているnkfでは
廣瀬> unicodeが扱えないためだと思います。
廣瀬> nkfの代りに ivconvや Jcode.pmを使うようにすればUTF-8でも
廣瀬> いけるような気がします(が試してません)。

Namazu は内部で EUC-jp を使っています。
SHIFT-JIS にない文字が EUC-jp で表記できるのかなあと思ったん
です。

でもね、その「SHIFT-JIS にない文字」を query で指定しない(で
きない)のであれば、

廣瀬> nkfの代りに ivconvや Jcode.pmを使うようにすればUTF-8でも
廣瀬> いけるような気がします(が試してません)。

UTF-8 -> EUC-jp 変換すれば Namazu で検索できることになります
よね。(単純に mknmz の前処理で実行していいんだと思う。)
-- 
こせき @ Wiki 始めました
http://www5d.biglobe.ne.jp/~kose/html/WelcomeVisitors.html