namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

ワープロやTIFFファイルの検索方法



こんにちは 小路@三菱重工です。
このたび本メーリングリストに参加させていただきました。
宜しくお願いします。
さて,さっそくですが
以下のような文書検索システムを考えています。できればNAMAZUのソースを
変更せずに実現したいのですが,方法があればお教えください。

目的:ワープロ(MS−WORD)や紙の文書を保管,検索する。

方法:サーバには実体(WORDファイルやスキャナから読み込んだTIFF
   ファイル)と,その内容をテキスト形式にしたものの,2種類のファイ
   ルを保管しておく。
   NAMAZUのインデックスはテキスト文書から作り,検索結果のURLは実体
   へのリンクとしたい。

以前にヘルパープログラムを作り,直接WORDやPDFからインデックス
を作るという手法が述べられていましたが,昔作った紙の資料も検索の対象
にしたいのです。

			

-------------------------------------------------------------------
小路 利明  Shoji Toshiaki
 所属  :三菱重工業株式会社 (神戸造船所駐在)
        エレクトロニクス技術部 システム技術開発センター 主務
 住所  :〒652-8585 神戸市兵庫区和田崎町1丁目1番1号 
  TEL   : 078-672-5961   マル線  60-5961
 FAX   : 078-672-5784            60-5784
  E-mail:  shoji@xxxxxxxxxxxxxxxxxx
------------------------------------------------------------------