臼田です Tadamasa Teranishi wrote: > > 本当は、.dxf, .dwg の検索に使えるフィルタを Namazu Project として > 用意できないかなという意味なのですが、このコマンドを呼び出す > フィルタを別に用意すればよいのかもしれません。 > (そのまま、取り込んでも良いのかもしれませんが、未確認なもので。) > 建築研究所提供のフィルタは外部のテキスト抽出プログラムを呼び出している タイプですね。 テキスト抽出プログラムは独立したバイナリファイルで、再配布はできない ようなことが書いてあったように思います。 mknmzでロードするPerlの部分だけ取り込んでもよいのかもしれませんが、 どうするのがよいのですかね。 ということで、dxf 関連の話題がでてきたので dxf フィルタの試作品を HDD の奥から発掘しました。 (テキスト版の dxf ファイルにのみ対応ですが、外部プログラムは不要です) バイナリ型の dxf ファイルについて情報収集していた際に建築研究所製の フィルタがあるのを見つけてそれ以上作業するのをやめてしまいましたが なにかの参考になるかもしれないので放流してみます。添付しています。 関心のある方のために、関連情報の uri も示しておきます。 DXF のフォーマットについてはバイナリ型も含め公開されているようです http://usa.autodesk.com/adsk/servlet/item?id=752569&siteID=123112 流し読みした範囲ではバイナリ型DXFフォーマットもそれほど複雑ではないようなので サンプルが十分にあればフィルタも書けると思います。 DXFだけならサンプルをいくつかもらえればもう少し手を加えて対応できるか と思っています。 DWG フォーマットは非公開だったと思いますが、独自解析によりパースして GPL で公開しているプログラムがありました。 http://www.flatmtn.com/cad/links-dwgsrcode.html こちらは難しそうです。 > > また、visioのファイルフォーマットも一部解析がされているようです。 > > http://www.redferni.uklinux.net/visio/ > > ここの情報でもテキスト抽出だけなら十分かもしれないのでVisio利用でない > > フィルタが作れるかもしれません。 > > みた限り難しそう。何方かがんばってみませんか? > -- visio も OLE ストレージのファイルなので taro7_10.plをベースにして この文献を参考に作っていけばなんとかできるとは思うのですが 日本語版では文字コードがどうなっているのかとか、実際のファイルを見 つつ調べる必要がありますね。 どなたか visio が好きな方に期待したいです。 臼田幸生
Attachment:
ascii_dxf.pl
Description: Binary data