Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Text::ChaSen core dump



<20000315.114542.100739113.shirai@xxxxxxxxxxxxxxxxxxx>の記事において
shirai@xxxxxxxxxxxxxxxxxxxさんは書きました。

>> まで(最後まで)が一行として扱われています。それを Chasen に一度に
>> 渡すので破綻しているようです。

  なるほど... 試しに、tr -d '\n' したファイルを Text::ChaSen に食わせ
てみたら、こちらでも segfault しました。

  -j は、あくまで文章の適当な区切記号で処理をわけるためのオプションな
ので、区切記号のない長い文字列を入力させるとやはりある程度のところで
segfault してしまうようです。

# 下手をすると exploit code をしこむこともできるかもしれませんね... ま
# あ、普通のユーザ権限で動作するプログラムなのでそれほど深刻ではないで
# すけど。

  なんにせよ、ChaSen を長い文字列でも segfault させないようにすること
は必要だと思います。segfault するぐらいなら、処理しきれない部分を
truncate する方がまだマシだと思うので、一度そのようにお願いしてみてい
ただけませんでしょうか > 高林さん

# 自分で hack する時間があんまりない... ;_;

>> というわけで、JIS 罫線の処理を mailnews.pl が失敗している(あるい
>> は意図してこうしている?)ように感じます。

  とりあえず、改行をなくさないようにする必要はありそうです。あと、
mailnews.pl で JIS 罫線を削除するようにするのはアリですかね...
-- 
野首 貴嗣
E-mail: knok@xxxxxxxxxxxxx (private)
        nokubi@xxxxxxxxx (official)