Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: macbinary.pl
寺西です。
Yukio USUDA wrote:
>
> macbinary.plについて
>
> Tadamasa Teranishi wrote:
> > 展開後のファイルタイプを返す方が良いでしょう。
> > (そして、この返されたファイルタイプを最優先で次のファイルタイプを
> > 決定する。)
> > フィルタの仕様を変えるのなら、HEAD だけの対応ですね。
> という案がありました。
>
> HEAD版のmknmzを見ていたところ
> Archive処理用にapplyfilter()にmimetypeに関する引数が追加
> されているのに気づいたので上記の案を試してみました。
おお。
> 多少強引ですがMS-Office系のファイルタイプも決定できます。
> これでよければcommitしようと思います。
ぱっと見た感じでは、$mmtype を filetype と creator を filetype 優先
で決定しているようですが、ここは常に filetype と creator のペアで
比較する方が良くないでしょうか?
> ちなみにテスト用のファイルのうちきちんとインデックスができ
> ないものが2つありますが、これは外部プログラムの制限による
> ものです。
はい。外部プログラムが対応していないデータもほり込んでいます。
> tests/data/ja-mac/word6.doc は
> word5形式のため現在のmsword.plでは無視されます。
> これは、無視できていることが正常な動作です。
確かそうだった。
> tests/data/ja-mac/powerpoint4.ppt は
> powerpointのバージョンが古いためかppthtmlが処理できず
バージョンは古かったと思います。
> 'Created ppthtml'といったヘッダ文のみが出力されるため
> ppthtmlはエラーを出さないのですが意味のないインデックス
> が出来上がります。
だったかどうかはよく覚えていません。
# が、たぶんそうなのでしょう。
しばらくテスト環境がないので確認できませんが、おそらく予定された
動作だと思います。
> このためja-namazu-2でエラーになるという症状がでます。
ppthtml の問題なら powerpoint4.ppt を削除するということで
良いかもしれません。
または、powerpoint.pl でバージョンチェックして弾くかですね。
(こっちの方が良いか。)
doccat も対応していないようなら削除しても良いかもしれません。
これを応用すれば、gzip や compress, bzip2 にも使えるわけですね。
--
=====================================================================
寺西 忠勝(TADAMASA TERANISHI) yw3t-trns@xxxxxxxxxxxxxxx
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E