Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: xlHtml on Solaris2.5.1
寺西です。
hsaka@xxxxxxxxxxxxxxxxx wrote:
>
> 修正版が xlHtml-0.2.7.1 としてリリースされました。
今更ですが、既に xlHtml-0.2.7.2 になっています。
> また、HomePage が、
> http://www.xlhtml.org/
> に移動しています。
ですね。http://www.namazu.org/doc/manual.html には
反映されていないようです。
ここの、
excel.pl
Excel文書を扱う
必需品: xlHtml
代替品: doccat
となっていますが、xlHtml を使うには lv が必須と言って良いのでは
ないでしょうか? (確にソースでは日本語環境でなければいらないのだが、
それは msword.pl でも同じような気がするし。)
> pptHtml(PowerPoint -> HTML)も Unicode 対応していますが実用になるか
> どうかは分かりません。文字情報だけは抽出可能と思いますが、
> 時々 '\0' が入ってしまうバグがあります。
'\0' が入ってしまうバグは除かれたようです。
生成される HTML ファイルは、実用的なものではありません(レイアウト
が壊れている)が、文字列を検索する目的には使えそうです。
xlHtml と同等の処理ルーチンを追加すれば、PowerPoint も検索できる
ようになるのではないでしょうか。
--
寺西