Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

縦書き横書き混じりの pdf ファイルの場合は?



横井です。

namazu 2.0.4 でPDFファイルの検索をしようと考えています。
縦書き横書き混じりのpdf ファイルは正しく検索できますか?
#実はまだnamazu はインストールしていません(^^;)。


SunOsにてxpdf-0.90 を使い、縦書き横書き混じりのpdf ファイルを
pdftotetx test.pdf などとして、test.txt を作成しました。
test.txt は横書きの部分を除いてぐちゃぐちゃになっていました。

このファイルをcat test.txt|kakasi -w|less としてみましたが、
縦書き部分はぐちゃぐちゃのままでした。

pdftotetx -raw test.pdf してできたtest.txt からはもう少し
ましなインデックスが作成できました。

このあたりの配慮ってされていますか?


とりあえず、明日ぐらいにnamazu をインストールして試してみます。
========================
横井
yokoi@xxxxxxxxx
========================