namazu-ml(avocado)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

searchpart



塩崎です。
ロボットの仕様にもよるんでしょうけど、URLの最後の「?〜」の部分がそのまま
保存されるもののために、以下のようなパッチを作りました。いかがでしょうか。
# すみません。namazu-1.3.0.0-beta-10用です。

*** mknmz.pl.orig	Fri Oct 30 15:21:30 1998
--- mknmz.pl	Fri Oct 30 15:30:50 1998
***************
*** 420,426 ****
  	print ERRORSFILE "$cfile $err\n"; 
  	return 0;  # エラーの場合は 0 でリターン
      }
!     if ($RobotExcludeOpt && $cfile =~ /\.($HTML_SUFFIX)$/i && 
  	$contents =~ /META\s+NAME\s*=\s*([\'\"]?)ROBOTS\1\s+[^>]*CONTENT\s*=\s*([\'\"]?).*?(NOINDEX|NONE).*?\2[^>]*>/i) {
  	$err = "is excluded because of <META> element.\n";
  	print $file_count + $file_segment . " $url $err\n";
--- 420,426 ----
  	print ERRORSFILE "$cfile $err\n"; 
  	return 0;  # エラーの場合は 0 でリターン
      }
!     if ($RobotExcludeOpt && $cfile =~ /\.($HTML_SUFFIX)(\?.*)?$/i && 
  	$contents =~ /META\s+NAME\s*=\s*([\'\"]?)ROBOTS\1\s+[^>]*CONTENT\s*=\s*([\'\"]?).*?(NOINDEX|NONE).*?\2[^>]*>/i) {
  	$err = "is excluded because of <META> element.\n";
  	print $file_count + $file_segment . " $url $err\n";
***************
*** 616,622 ****
      analize_rcs_stamp();
      $mhonarc_opt = 1 if 
  	(!$NoMHonArcOpt && $$contents =~/^$MHONARC_HEADER/);
!     if ($cfile =~ /\.($HTML_SUFFIX)$/i || $cfile =~ /($DEFAULT_FILE)$/) {
  	mhonarc_filter($contents, $weighted_str) 
  	    if $mhonarc_opt;
  	html_filter($contents, $weighted_str, $title, $fields, $headings);
--- 616,622 ----
      analize_rcs_stamp();
      $mhonarc_opt = 1 if 
  	(!$NoMHonArcOpt && $$contents =~/^$MHONARC_HEADER/);
!     if ($cfile =~ /\.($HTML_SUFFIX)(\?.*)?$/i || $cfile =~ /($DEFAULT_FILE)(\?.*)?$/) {
  	mhonarc_filter($contents, $weighted_str) 
  	    if $mhonarc_opt;
  	html_filter($contents, $weighted_str, $title, $fields, $headings);
***************
*** 1426,1432 ****
      my ($tmp) = @_;
      my ($url);
      $url = $tmp;
!     $url =~ s!(.*)\Q$PSC\E($DEFAULT_FILE)$!$1/!; #省略可能なファイル名なら削除
      $url =~ s/\Q$TARGET_DIR$PSC\E/$URL_PREFIX/;
      if (($SYSTEM eq "MSWin32") || ($SYSTEM eq "os2")) {
  	# Shift_JIS の漢字を考慮して \ を / に変換 [09/26/1998]
--- 1426,1432 ----
      my ($tmp) = @_;
      my ($url);
      $url = $tmp;
!     $url =~ s!(.*)\Q$PSC\E($DEFAULT_FILE)(\?.*)?$!$1/$3!; #省略可能なファイル名なら削除
      $url =~ s/\Q$TARGET_DIR$PSC\E/$URL_PREFIX/;
      if (($SYSTEM eq "MSWin32") || ($SYSTEM eq "os2")) {
  	# Shift_JIS の漢字を考慮して \ を / に変換 [09/26/1998]
***************
*** 1641,1647 ****
      my ($name) = @_;
      push(@FList, $name) if 
  	( (! /^(($DENY_FILE)(\.gz|\.Z)?)$/i) &&
! 	 /^(($TARGET_FILE)(\.gz|\.Z)?)$/i && -f $_ && -r $_);
  }
  
  # インデックスの追加の準備を行う
--- 1641,1647 ----
      my ($name) = @_;
      push(@FList, $name) if 
  	( (! /^(($DENY_FILE)(\.gz|\.Z)?)$/i) &&
! 	 /^(($TARGET_FILE)(\.gz|\.Z|\?.*)?)$/i && -f $_ && -r $_);
  }
  
  # インデックスの追加の準備を行う

-- 
ただし、私は耳鼻咽喉が弱いので、会議は禁煙にしてください。
--
塩崎 毅彦(SHIOZAKI Takehiko)	<takehi-s@xxxxxxxxxxx>
Technical Center,	ASCII CORPORATION