Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

macbinary.pl



臼田です

8月ごろの話題でしたが
macbinary.plについて

Tadamasa Teranishi wrote:
> 展開後のファイルタイプを返す方が良いでしょう。
> (そして、この返されたファイルタイプを最優先で次のファイルタイプを
> 決定する。)
> フィルタの仕様を変えるのなら、HEAD だけの対応ですね。
という案がありました。

HEAD版のmknmzを見ていたところ
Archive処理用にapplyfilter()にmimetypeに関する引数が追加
されているのに気づいたので上記の案を試してみました。
多少強引ですがMS-Office系のファイルタイプも決定できます。
これでよければcommitしようと思います。

ちなみにテスト用のファイルのうちきちんとインデックスができ
ないものが2つありますが、これは外部プログラムの制限による
ものです。

tests/data/ja-mac/word6.doc は
word5形式のため現在のmsword.plでは無視されます。
これは、無視できていることが正常な動作です。

また、
tests/data/ja-mac/powerpoint4.ppt は
powerpointのバージョンが古いためかppthtmlが処理できず
'Created ppthtml'といったヘッダ文のみが出力されるため
ppthtmlはエラーを出さないのですが意味のないインデックス
が出来上がります。
このためja-namazu-2でエラーになるという症状がでます。
(macbinaryのヘッダ部を除去したファイルをppthtmlに渡すと
確認できます)

臼田幸生

Attachment: macbinary.pl
Description: Binary data