Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: cannot apply to Word documents by namazu 2.0.5 on FreeBSD 4.3
みやしたです。
At Thu, 6 Sep 2001 18:52:35 +0900,
Yoshinori TAKESAKO wrote:
> 竹迫です。
>
> > LANG=ja_JP.EUC と設定していることを失念してました ^^;
>
> とりあえず、素直に LANG=ja_JP.EUC の設定のままで、
> 足りない lv をインストールされてみてはどうでしょうか?
> [...]
ということでインストールしてみました。当然ながら LANG=ja_JP.EUC でもちゃ
んと application/msword が扱えるようになりました。
# でも大量に wvError が出て見ため処理が止まっているように見えます ^^;
# catdoc だとサクサクとインデックスを作ってくれたので、悩んでしまいます。
> これでも Word 形式のファイルがうまく取り扱えない場合は、
> Namazu for Win32 版の OLEフィルタを利用する方法が確実だと思います。
>
> # 確かに、MS Word を OLE 経由で起動させるので、処理は重たくなる
> # 欠点もありますが、MS Word の読み込める文書は、確実に処理できる
> # いった利点もあります。(^^;
こちらなんですが、どうも今回対象とした英語の Word のファイルでは、うまく
インデックスが作れない状態です。
# この件は改めて win32-users-ja に投げるつもりではおりますが。
Windows 2000 Professional に Office 97 一式をインストールした状態で
Namazu 2.0.6 for Win32 を導入してみたのですが、あきらかに本文中に含まれ
ているキーワードがうまく抜き出せていないように見えてます。同じ環境で、日本語を含んだ
Word/PowerPoint/Excel のファイルについてはうまくキーワードが抜き出せてい
るように見えたので、参考比較に UNIX 版に挑戦した次第です。
--
|宮 下 重 博♪ mailto:mya@xxxxxxxxxx
|--
|Nobody expects Spanish Inquisition!