Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: xlHtml on Solaris2.5.1



寺西です。

hsaka@xxxxxxxxxxxxxxxxx wrote:
> 
> 修正版が xlHtml-0.2.7.1 としてリリースされました。

今更ですが、既に xlHtml-0.2.7.2 になっています。

> また、HomePage が、
>   http://www.xlhtml.org/
> に移動しています。

ですね。http://www.namazu.org/doc/manual.html には
反映されていないようです。
ここの、

excel.pl 
     Excel文書を扱う 
     必需品: xlHtml 
     代替品: doccat 

となっていますが、xlHtml を使うには lv が必須と言って良いのでは
ないでしょうか? (確にソースでは日本語環境でなければいらないのだが、
それは msword.pl でも同じような気がするし。)

> pptHtml(PowerPoint -> HTML)も Unicode 対応していますが実用になるか
> どうかは分かりません。文字情報だけは抽出可能と思いますが、
> 時々 '\0' が入ってしまうバグがあります。

'\0' が入ってしまうバグは除かれたようです。
生成される HTML ファイルは、実用的なものではありません(レイアウト
が壊れている)が、文字列を検索する目的には使えそうです。

xlHtml と同等の処理ルーチンを追加すれば、PowerPoint も検索できる
ようになるのではないでしょうか。
--
寺西