Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: cannot apply to Word documents by namazu 2.0.5 on FreeBSD 4.3



みやしたです。

At Thu, 6 Sep 2001 18:52:35 +0900,
Yoshinori TAKESAKO wrote:
> 竹迫です。
> 
> > LANG=ja_JP.EUC と設定していることを失念してました ^^;
> 
> とりあえず、素直に LANG=ja_JP.EUC の設定のままで、
> 足りない lv をインストールされてみてはどうでしょうか?
> [...]

ということでインストールしてみました。当然ながら LANG=ja_JP.EUC でもちゃ
んと application/msword が扱えるようになりました。

# でも大量に wvError が出て見ため処理が止まっているように見えます ^^;
# catdoc だとサクサクとインデックスを作ってくれたので、悩んでしまいます。

> これでも Word 形式のファイルがうまく取り扱えない場合は、
> Namazu for Win32 版の OLEフィルタを利用する方法が確実だと思います。
> 
> # 確かに、MS Word を OLE 経由で起動させるので、処理は重たくなる
> # 欠点もありますが、MS Word の読み込める文書は、確実に処理できる
> # いった利点もあります。(^^;

こちらなんですが、どうも今回対象とした英語の Word のファイルでは、うまく
インデックスが作れない状態です。

# この件は改めて win32-users-ja に投げるつもりではおりますが。

Windows 2000 Professional に Office 97 一式をインストールした状態で
Namazu 2.0.6 for Win32 を導入してみたのですが、あきらかに本文中に含まれ
ているキーワードがうまく抜き出せていないように見えてます。同じ環境で、日本語を含んだ
Word/PowerPoint/Excel のファイルについてはうまくキーワードが抜き出せてい
るように見えたので、参考比較に UNIX 版に挑戦した次第です。

-- 
|宮 下  重 博♪  mailto:mya@xxxxxxxxxx
|--
|Nobody expects Spanish Inquisition!