Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: pdf のカタカ
鍋坂です。
>普通の text file などの PDF 以外もカタカナで検索できないのですか?
>PDF だけなら、その検索できないファイルを手動で
>
>% pdftotext file.pdf tmp.txt
>
>と Text に変換して、tmp.txt の中身をみて壊れていないか確かめると
>良いと思います。
>
>## ちなみに、検索式にカタカナを使う場合は、全角カタカナじゃない
>## とダメですけど、そういう問題?
text、htmlファイル及びAcrobatWriterで作成したpdfファイルでは
問題無く全角カタカナ検索できています。
問題のpdfファイルは各ページにマーク(付箋を貼るイメージ)を付け
る必要があった為、原本(一太郎ファイル)をPostScriptファイルに
変換、編集しました。そのPostScriptファイルを使用し、Acrobat
Distillerでのpdf化を行なっています。
PostScriptファイルの編集内容にも問題があるのでしょうか。尚、
PostScriptファイルに記述した内容は以下の通りです。
[PostScriptに記述した文]
#############################################################
systemdict/pdfmark known not{userdict/pdfmark systemdict/
cleartomark get put}if
[/Dest/P2
/Page 2
/DEST pdfmark
[/Dest/P3
/Page 3
/DEST pdfmark
[/Dest/P4
/Page 4
/DEST pdfmark
[/Dest/P5
/Page 5
/DEST pdfmark
%%EOF
#############################################################
環境は以下の通りです。
・Windows98 + Netscape4.06
・namazu 2.0.5
・kakasi 2.3.2
・ActivePerl 5.6.0.522
・pdftotext 0.92(xpdf-0.92-win32-ms.zip)
・AcrobatReader 4.0J
・AcrobatDistiller4.0