namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
 Re: namazu.el, bnamazu, NamazuJAVA
- From: Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx>
 
- Date: Fri, 10 Jul 1998 12:15:43 +0900
 
- X-ml-name: namazu
 
- X-mail-count: 00922
 
古川です。
>> On Fri, 10 Jul 1998 01:01:23 +0900, Satoru Takabayashi <ccsatoru@xxxxxxxxxxxxxxxxxx> said:
  > DejaNews の fj.*, japan.* 版を望む今日このごろ
私も、なんとかならないかと思って試行錯誤しているのですが…
いろいろ実験してみると、今のところ、DejaNews では、
    JIS コードなどは、そのままの状態で
    EUC については、bit 7 を落として
扱っているようですね。
例えば、「高林」という語は、
    JIS コードの場合は ESC $ B 9 b N S ESC ( B
    EUC の場合は 9 b N S
としているようです。よって、$B9bNS* | 9bNS* で検索すれば、「高林」が
かなりヒットします。中間一致が無いのがつらいところですが。
# '$B9bNS' などという、意味不明の文字列を検索する、という行為に、不毛
# さを感じずにはいられませんが。
というわけで、私は、こういった変換をして、Location: ヘッダを返す cgi
を使っています。ただ、変換結果が記号になってしまうとお手あげですが。
あとは、delegate の "CHARCODE=fix" を経由させると、日本語の文字化けは
少しマシになります。
-- 
                                        ヤマハ(株)ピアノプレーヤ設計課
                                                              古川 令
                                             furukawa@xxxxxxxxxxxxxxxx