namazu-dev(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Namazu for Win32 binary snap release 20000215



広瀬です。

 <shirai@xxxxxxxxxxxxxxxxxxx> wrote.
/~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
>isdigit の話と sjis なメールの mknmz の話は全然違う(のじゃないか
>な?と勝手に思っている)ので、元の山下さんのメールからはじめさせ
>ていただきます。^^;;;

isdigit な話はちんぷんかんぷんですが、 
sjis なメールの mknmz の話は判りました。

>そう言われれば、そうだよなぁと思い、(B|Q)-encode を解いて sjis
>で書いても *だめだめ* だったのですが、自動認識や --mailnews の設
>定を止めて、
>% mknmz --media-type=plain/text (以下略)
>としたら、ちゃんとした INDEX が出来ました。

CR+LF な mail or news は win, unix に関係なく out のようです。

$weighted_str の処理で \r が入っているとだめなようなので、
mknmz.in の 613 行目に $$contref =~ s/\r//g; を入れればいけるようです。

---8<------8<------8<------8<------8<------8<------8<------8<------8<---
	return ($file_size, $file_size, 0, 'x-system/x-error');
    }

    $$contref = util::readfile($cfile);
    $$contref =~ s/\r//g;              <-------- これ
#    $file_size = length($$contref);

    # Filtering process.
    my $mtype;
---8<------8<------8<------8<------8<------8<------8<------8<------8<---

但し、\r が入っているとまずそうなのは今のところ mailnews.pl だけみたいなので
もっと下位で取った方がいいかもしれません。。。

>## ただし、NMZ.field.from は全部『不明』なのですけどもね。:-)

;-)

   Best regards,
--
Ken-ichi Hirose (^^)k!
e-mail: hirose@xxxxxxxxxxxxxxxxxxxx