namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: man filter(Re: tknamazu v1.02)



昔、man ページを翻訳するプロジェクトの立ちあげの時に議論したことがあるん
だけど、man ページって出力の体裁を整えているだけで、内部の体裁はバラバラ
だから、解読するのは困難ですよね。その意味で、groff の出力を対象にするの
は正しい方法だと思います。

# 市販されている UNIX なら、多少は統一されてるだろうけど、、

From: Satoru Takabayashi <ccsatoru@xxxxxxxxxxxxxxxxxx>
Subject: [namazu:00512] Re: man filter(Re: tknamazu v1.02)
Date: Fri, 10 Apr 1998 17:47:40 +0900
Message-ID: <199804100858.RAA14998@xxxxxxxxxxxxxxxxxx>

> OPT_HELPER_MAN		= /usr/bin/jgroff -man -Tnippon
> 
> という行があるのでこれを修正します。で、インデックスを作るときは

このあたりは機種依存するのでいくつか例をあげるしか無いと思いますが、
NET-2 由来のコマンドを入れている UNIX だと(free な PC-UNIX はたいていそ
うかな?) -mandoc オプションが必要なようです。

# 最近の man ページ翻訳プロジェクトでは -mandocj を使っているようです。

> みたいにいろいろあったのであきらめました。仕方がないので -r オプショ
> ンをつけたときは
> 
> $TARGET_FILE = '.*\.\d.*';
> 
> を対象とすることにしました。

mann なんてのもありました。

それから、Linux の場合、man ページの中身が全く統一されていないので、手元
の man ページを登録しながら引っかかるものを追加していったら、DESCRIPTION 
部の検出がこんな感じになりました ;-)

s/([\s\S]+^(?:DESCRIPTION|DESCRIPTIONS|DESCRIPTION 解説|SHELL GRAMMAR|INTRODUCTION|【概要】|解説|説明|機能説明|基本機能説明)\s*\n)//im) 



--------------------------------+--------------------------
Don't expect life to be fair.   | こじまみつひろ
     -- Kennedy family motto    | isle@xxxxxxxxxxxx
                                | kojima@xxxxxxxxxxxxxxxxxxx
--------------------------------+---------------------------