Namazu-win32-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
pdftotext にて文字化けします。
- From: iwasaki jyunko <jyunko@xxxxxxxxxxxxxxxxxxx>
- Date: Thu, 14 Mar 2002 17:07:38 +0900
- X-ml-name: namazu-win32-users-ja
- X-mail-count: 01309
はじめまして。
岩崎と申します。どうぞ、よろしくお願いします。
イントラにて「namazu検索機能」を導入したいと考えています。
そこで、質問です。
現在、Windows98にnamazuをインストールしています。
検索は、html,Word,exel,textファイルは成功しています。
しかし、PDFファイルの部分で失敗しています。
過去メールを参照させていただき、PDFのファイル名の検索は可能と
なりました。
ですが、検索結果画面でPDFファイルの検索結果が
文字化けしています。
============== 検索画面 ======================
検索結果
参考ヒット数: [ pdf: 118 ]
検索式にマッチする 118 個の文書が見つかりました。
1. sysm_inst.pdf (スコア: 19)
著者: 不明
日付: Thu, 12 Apr 2001 17:02:24
System Managerx|矛・ z鐵 PCwg||坊0ftzAs愧>)B`|慣 tK"g・ 苣暗`o g|矇b"\ q>q`h膏帳zpb{,^h概
========================================================================
現状の問題は、下記です。
・PDFファイル名を検索しており、PDFファイルの中身は検索されていない
・半角英数字は変換可能であるが、漢字が変換されていない。
・DOS上でpdftotextを使用し、PDFファイルをtextファイルに変換しようとしたが、
変換されたtextファイルの中身は、文字化けであった。
問題はpdftotextにあると思うのですが、解決策が見つかりません。
みなさまにて、この問題を解決されたという方または解決策をご存知の方が
いらっしゃれば、ぜひご教示願います。
現在本当に困っており、皆様に不躾な質問だと承知の上、
メールさせていただきました。
現在の環境は、下記です。
namazu:Namazu for Win32 (ver 2.0.8)
CGI :perl5.6.1
XPDF:pdftotxt(xpdf-1.00-win32-ms.zip)
C:\namazu\bin\下に「xpdf-japanese,tar,gz」も
格納しています
※:xpdf-0.92-win32-ms.zipも使用してみましたが、
結果は同じでした。
OS :Windows98
※:テスト環境として、クライアントPCをローカルサーバに
しています。(httpdを使用)
どうぞ、よろしくお願いします。
岩崎
----
Jyunko Iwasaki jyunko@xxxxxxxxxxxxxxxxxxx