Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: MHonArc の Subject 処理



At Thu, 13 Sep 2001 15:40:04 JST,
NOKUBI Takatsugu wrote:
> >> またまた woody ですが、mhonarc のアーカイブを
> >> index すると、Subject: の処理が変です。
> >> 
> >> <TITLE>[hoge:00740] Re:
> >> よろしくおねがいします
> >> </TITLE>
> >> 
> >> の NMZ.field.subject が、
> >> 
> >> [hoge:00740] Re:
> >> 
> >> になっています。なんか 1行目しか処理されてないような。
> 
>   ううむ、sid で確認した分には問題なさそうですが... filter/mhonarc.pl
> での TITLE の処理は、実際には filter/html.pl の get_title() が利用され
> るので、MHonArc でこの問題が起きるのであれば HTML でも起きるはずです。
>   その辺りはどうでしょうか?

s モディファイアがないだけ?

*** html.pl.old	Sat Jan 13 18:16:04 2001
--- html.pl	Wed Sep 12 11:44:35 2001
***************
*** 145,151 ****
      my ($contref, $weighted_str) = @_;
      my $title = '';
      
!     if ($$contref =~ s!<TITLE[^>]*>([^<]+)</TITLE>!!i) {
  	$title = $1;
  	$title =~ s/\s+/ /g;
  	$title =~ s/^\s+//;
--- 145,151 ----
      my ($contref, $weighted_str) = @_;
      my $title = '';
      
!     if ($$contref =~ s!<TITLE[^>]*>([^<]+)</TITLE>!!is) {
  	$title = $1;
  	$title =~ s/\s+/ /g;
  	$title =~ s/^\s+//;

-- 
SATOH Fumiyasu - fumiya @net-thrust.com, @samba.gr.jp, @namazu.org or ...
THRUST Co., Ltd. @ Fujisawa, Kanagawa, Japan - http://www.net-thrust.com
Samba-JP, aka `Samba Users Group Japan'      - http://www.samba.gr.jp
Apache-JP(?), aka `Japan Apache Users Group' - http://www.apache.jp
Namazu, a full-text search engine            - http://www.namazu.org