namazu-dev(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

wish list (...low priority)



馬場@京大宇宙物理 です。

2.0 に向かっての開発ご苦労様です。最近のコードにはまったくついてい
けていませんので口先だけで申し訳ないのですが、希望というかなんとい
うかあるので、いちおう表明だけしておきます。

# ただまあ、low priority ではあるので、できれば、ということで。


1. 要約部分を、mknmz 本体から Text::Summary のような別ルーチン(名
前は適当ですが) に追い出すようなことは可能でしょうか?

ずっと以前から考えていたことなのですが、たとえば、要約付きのリンク
集なんかを安直に作りやすくなって便利かな、なんておもっているので。
URL リストからなるファイルを食わせて、

printHeader();
while(<>) {
    my($url) = split;
    my($title) = getTitle($url);
    my($summary) = getSummary($url);

    print "<DT><A HREF=\"$url\">$title</A></DT>\n";
    print "<DD>$summary</DD>";
}
printFooter();

みたいなイメージです。MHonArc への拡張というのもあり得るでしょう
(実際に見易いかはともかく)。応用例はたくさんあるとおもいます。

また、それ以上に、要約ルーチンを切り分けて単体にしておけば、(bit 
の今月号にあったような)「言い換えによる自動要約システム」の考え方
の適用もやりやすくなるのではないか、引いては要約の精度向上につなが
るかも、とおもっています。


2. mswordview と同じようなものに、wv というものがあるようです。

 % wvHtml foobar.doc | iconv -f UTF-8 -t EUC-JP | sed 's/UTF-8/EUC-JP/g' > foobar.html

のようにして使うみたいです。もしかしたら、これにも対応するといいの
かもしれません。http://www.wvWare.com/ です。VineSeedPlus には rpm 
があるようです。
--
馬場  肇 ( Hajime BABA )            E-mail: baba@xxxxxxxxxxxxxxxxxxxxxx
京都大学理学部宇宙物理学教室 博士後期課程
--