namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: namazu 1.3.0.8 patch for mknmz



kenzo-@xxxxxxxxxx (Ken-ichi Hirose) wrote:

>>> >・フィールド指定の後方一致検索ができない
>>> >(各 field インデックスファイルの改行コードが \r\n になっているのが原因)
>
>namazu-ml の archive で +from:iros* とか +from:iros とかやっても
>必ず中間一致になってしまい後方一致で問題が解決できたか
>確認できなかったのですが。。

フィールド指定検索においての後方一致は +from:*iros または 
+from:/iros$/ のように指定します。


>#そういえば xpdf が 0.90 になって -eucjp で出力できるように
>#なっていました。 :-)

あ、本当ですね。さっそく <http://www.foolabs.com/xpdf/> から
取ってきて試しました。

対象ファイルとして「プレゼン道入門改定第2.2版」(これは面白い)
<http://nova.planet.sci.kobe-u.ac.jp/~matsuda/review/presen2.PDF>
を pdftotext -eucjp でテキストに変換したところ、一部、文字化
けしました。

調べてみると、いわゆる全角空白におかしなコード (\xa1\xa0) が
ところどころ使われていたので、 perl で

 % perl -i -pe  's/\xa1\xa0/\xa1\xa1/g'  presen2.txt

と単純に変換をかけて解決しました。後から作者に連絡しておきま
す。

# Decryption patches for xpdf 0.80 が 0.90 には当たらなくて
# 悲しい…。ちなみに、私は普段は Linux 用の Acrobat Reader
# 4.0 を使っています。日本語がきちんと表示できます。

-- Satoru Takabayashi