Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Text::ChaSen core dump
白井です。実験してみました。
From: knok@xxxxxxxxxxxxx (NOKUBI Takatsugu) さん曰く
Subject: [namazu-devel-ja] Text::ChaSen core dump
Message-ID: <200003140934.SAA18488@xxxxxxxxxxxxx>
Date: Tue, 14 Mar 2000 18:34:39 JST
knok> >> mknmz(Text::ChaSen)でIndexingしようとすると core dump します。
knok>
knok> とりあえず、以下の script で Text::ChaSen にかけてみましたが、問題あ
knok> りませんでした。
野首さんの script だと OK なのですが、実際に mknmz したら
'Segmentaion fault' でした。
## Solaris 2.4 + perl 5.005_02 + gcc 2.95.2 + chasen 2.02
## + Text::ChaSen 0.20
--debug をつけて中身をみたのですが、なぜか 'failedmail' を mknmz
すると
debug> @@ モジュール: mailnews.pl
debug> @@ Processing mail/news file ...
debug> // -- title --
debug> // ULIS-Lib:New Material
debug> // -- content --
debug> // 新着資料情報
debug> // 2月18日からの新着資料です。
debug> // ┌─┬──────────────────────────────────┐│項│ 内 容 ││番│ │├─┼──────────────────────────────────┤│1 │500 tips for academic librarians / Sally Brown, Bill Downey, Phil ││ │Race.-- Library Association Publishing, 1997. │├─┼──────────────────────────────────┤│2 │ACRL un
となり、これ以降
debug> 江南先生訓訳 ; 都留春雄, 釜谷武志校注.-- 平凡社, ││ │2000.-- (東洋文庫 ; 666). │└─┴──────────────────────────────────┘
まで(最後まで)が一行として扱われています。それを Chasen に一度に
渡すので破綻しているようです。
また、failedmail の最後に普通の文章をいれたところ、そこでは、ま
た、一行が一行として扱われていました。
というわけで、JIS 罫線の処理を mailnews.pl が失敗している(あるい
は意図してこうしている?)ように感じます。
## kakasi は一行でいれても大丈夫だった。
普通のメールだと
@@ モジュール: mailnews.pl
@@ Processing mail/news file ...
//
//
// <<<<小関 吉則 (KOSEKI Yoshinori) <kose@xxxxxxxxxxxxxxxxxx> writes:>>>>
// -- title --
// Re: Domain Name Server
// -- content --
// 先ほどから、内容がぜんぜんわからないっす。^^;;;
// MUAの乗り換えは重労働ですからね。あんまりやりたくないです。
の様にそれぞれの行で分割されますよね。
--
白井秀行 (mailto:shirai@xxxxxxxxxxxxxxxxxxx)