Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: namazu での PDF 検索について



寺西です。

arg00032@xxxxxxxxxxxxxxxxxx wrote:
> 
> ♪というような出力が得られます。日本語に対応していれこれを
> ♪使う方がすっきりするのですが残念です。

日本語が無茶くちゃですね。(^^;

>  pdfinfo、なんとなく役に立ちそうなきがするのですが
> 残念ですということは、日本語対応されていないのですか?

というような出力が得られます。これが日本語に対応して
おれば、これを使うというのが、すっきりするのですが、
日本語に対応していないので残念ながら使えないです。
(もちろん英語なら可)

と、いう文章に変えさせていただきます。
 
> -eucjpと-rawでは変換されたファイルの1行目がちがいます。
> -eucjpではPDF本文の一番始めにかき出された一文のようですが
> -rawですとどこに設定された文章なのかわからないのですが
> なんだか使えそうなちょうど良い一文が出力されます。

あぁ、そうなんですか。tests/data/ja/acrobat4.pdf というのが
Namazu のアーカイブには含まれているのですが、これを処理した
場合、-eucjp と -raw には違いがなかったものですから、
わざわざ -raw にする必要があるのかなと思っただけです。

使えるのなら -raw を使うのもいいかもしれません。
特にタイトルだけなら -f 1 も付けてしまうとか。
(本文の処理とわけて、本文側は -eucjp のままにするとか) 
--
寺西