Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: namazu での PDF 検索について
寺西です。
arg00032@xxxxxxxxxxxxxxxxxx wrote:
>
> ♪というような出力が得られます。日本語に対応していれこれを
> ♪使う方がすっきりするのですが残念です。
日本語が無茶くちゃですね。(^^;
> pdfinfo、なんとなく役に立ちそうなきがするのですが
> 残念ですということは、日本語対応されていないのですか?
というような出力が得られます。これが日本語に対応して
おれば、これを使うというのが、すっきりするのですが、
日本語に対応していないので残念ながら使えないです。
(もちろん英語なら可)
と、いう文章に変えさせていただきます。
> -eucjpと-rawでは変換されたファイルの1行目がちがいます。
> -eucjpではPDF本文の一番始めにかき出された一文のようですが
> -rawですとどこに設定された文章なのかわからないのですが
> なんだか使えそうなちょうど良い一文が出力されます。
あぁ、そうなんですか。tests/data/ja/acrobat4.pdf というのが
Namazu のアーカイブには含まれているのですが、これを処理した
場合、-eucjp と -raw には違いがなかったものですから、
わざわざ -raw にする必要があるのかなと思っただけです。
使えるのなら -raw を使うのもいいかもしれません。
特にタイトルだけなら -f 1 も付けてしまうとか。
(本文の処理とわけて、本文側は -eucjp のままにするとか)
--
寺西