Namazu-win32-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: pdf のカタカ



鍋坂です。
>普通の text file などの PDF 以外もカタカナで検索できないのですか?
>PDF だけなら、その検索できないファイルを手動で
>
>% pdftotext file.pdf tmp.txt
>
>と Text に変換して、tmp.txt の中身をみて壊れていないか確かめると
>良いと思います。
>
>## ちなみに、検索式にカタカナを使う場合は、全角カタカナじゃない
>## とダメですけど、そういう問題?

text、htmlファイル及びAcrobatWriterで作成したpdfファイルでは
問題無く全角カタカナ検索できています。

問題のpdfファイルは各ページにマーク(付箋を貼るイメージ)を付け
る必要があった為、原本(一太郎ファイル)をPostScriptファイルに
変換、編集しました。そのPostScriptファイルを使用し、Acrobat
Distillerでのpdf化を行なっています。
PostScriptファイルの編集内容にも問題があるのでしょうか。尚、
PostScriptファイルに記述した内容は以下の通りです。

[PostScriptに記述した文]
#############################################################
  systemdict/pdfmark known not{userdict/pdfmark systemdict/
  cleartomark get put}if
 
  [/Dest/P2
  /Page 2
  /DEST pdfmark
  [/Dest/P3
  /Page 3
  /DEST pdfmark
  [/Dest/P4
  /Page 4
  /DEST pdfmark
  [/Dest/P5
  /Page 5
  /DEST pdfmark

  %%EOF
#############################################################

環境は以下の通りです。

 ・Windows98 + Netscape4.06
 ・namazu 2.0.5
 ・kakasi 2.3.2
 ・ActivePerl 5.6.0.522
 ・pdftotext 0.92(xpdf-0.92-win32-ms.zip)
 ・AcrobatReader 4.0J
 ・AcrobatDistiller4.0