namazu-ml(avocado)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
searchpart
- From: SHIOZAKI Takehiko <takehi-s@xxxxxxxxxxx>
- Date: Fri, 30 Oct 1998 15:32:55 +0900
- X-ml-name: namazu
- X-mail-count: 01516
塩崎です。
ロボットの仕様にもよるんでしょうけど、URLの最後の「?〜」の部分がそのまま
保存されるもののために、以下のようなパッチを作りました。いかがでしょうか。
# すみません。namazu-1.3.0.0-beta-10用です。
*** mknmz.pl.orig Fri Oct 30 15:21:30 1998
--- mknmz.pl Fri Oct 30 15:30:50 1998
***************
*** 420,426 ****
print ERRORSFILE "$cfile $err\n";
return 0; # エラーの場合は 0 でリターン
}
! if ($RobotExcludeOpt && $cfile =~ /\.($HTML_SUFFIX)$/i &&
$contents =~ /META\s+NAME\s*=\s*([\'\"]?)ROBOTS\1\s+[^>]*CONTENT\s*=\s*([\'\"]?).*?(NOINDEX|NONE).*?\2[^>]*>/i) {
$err = "is excluded because of <META> element.\n";
print $file_count + $file_segment . " $url $err\n";
--- 420,426 ----
print ERRORSFILE "$cfile $err\n";
return 0; # エラーの場合は 0 でリターン
}
! if ($RobotExcludeOpt && $cfile =~ /\.($HTML_SUFFIX)(\?.*)?$/i &&
$contents =~ /META\s+NAME\s*=\s*([\'\"]?)ROBOTS\1\s+[^>]*CONTENT\s*=\s*([\'\"]?).*?(NOINDEX|NONE).*?\2[^>]*>/i) {
$err = "is excluded because of <META> element.\n";
print $file_count + $file_segment . " $url $err\n";
***************
*** 616,622 ****
analize_rcs_stamp();
$mhonarc_opt = 1 if
(!$NoMHonArcOpt && $$contents =~/^$MHONARC_HEADER/);
! if ($cfile =~ /\.($HTML_SUFFIX)$/i || $cfile =~ /($DEFAULT_FILE)$/) {
mhonarc_filter($contents, $weighted_str)
if $mhonarc_opt;
html_filter($contents, $weighted_str, $title, $fields, $headings);
--- 616,622 ----
analize_rcs_stamp();
$mhonarc_opt = 1 if
(!$NoMHonArcOpt && $$contents =~/^$MHONARC_HEADER/);
! if ($cfile =~ /\.($HTML_SUFFIX)(\?.*)?$/i || $cfile =~ /($DEFAULT_FILE)(\?.*)?$/) {
mhonarc_filter($contents, $weighted_str)
if $mhonarc_opt;
html_filter($contents, $weighted_str, $title, $fields, $headings);
***************
*** 1426,1432 ****
my ($tmp) = @_;
my ($url);
$url = $tmp;
! $url =~ s!(.*)\Q$PSC\E($DEFAULT_FILE)$!$1/!; #省略可能なファイル名なら削除
$url =~ s/\Q$TARGET_DIR$PSC\E/$URL_PREFIX/;
if (($SYSTEM eq "MSWin32") || ($SYSTEM eq "os2")) {
# Shift_JIS の漢字を考慮して \ を / に変換 [09/26/1998]
--- 1426,1432 ----
my ($tmp) = @_;
my ($url);
$url = $tmp;
! $url =~ s!(.*)\Q$PSC\E($DEFAULT_FILE)(\?.*)?$!$1/$3!; #省略可能なファイル名なら削除
$url =~ s/\Q$TARGET_DIR$PSC\E/$URL_PREFIX/;
if (($SYSTEM eq "MSWin32") || ($SYSTEM eq "os2")) {
# Shift_JIS の漢字を考慮して \ を / に変換 [09/26/1998]
***************
*** 1641,1647 ****
my ($name) = @_;
push(@FList, $name) if
( (! /^(($DENY_FILE)(\.gz|\.Z)?)$/i) &&
! /^(($TARGET_FILE)(\.gz|\.Z)?)$/i && -f $_ && -r $_);
}
# インデックスの追加の準備を行う
--- 1641,1647 ----
my ($name) = @_;
push(@FList, $name) if
( (! /^(($DENY_FILE)(\.gz|\.Z)?)$/i) &&
! /^(($TARGET_FILE)(\.gz|\.Z|\?.*)?)$/i && -f $_ && -r $_);
}
# インデックスの追加の準備を行う
--
ただし、私は耳鼻咽喉が弱いので、会議は禁煙にしてください。
--
塩崎 毅彦(SHIOZAKI Takehiko) <takehi-s@xxxxxxxxxxx>
Technical Center, ASCII CORPORATION