namazu-ml(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: How to make Huge Index



畠田@オムロンソフトウェア です。

 <199906101301.WAA08669@xxxxxxxxxxxxxx> の、
 "[namazu 780] Re: How to make Huge Index" において
 sugiura@xxxxxxxxxxxx (Sugiura Shiro) さんは書きました。


> 私は、PentiumII(333,350,400,450,500,) + 256MByte Memory + FreeBSD2.2.8
> RELEASEで、
> 
> [Base]
> Date: Thu May 20 00:11:37 1999
> Added Files: 507,744 files
> Total Files: 507,744 files
> Size: 1,291,674,747 bytes
> Added Keywords: 5,287,123 words
> Total Keywords: 5,287,123 words
> Wakati: module_kakasi -ieuc -oeuc -w
> ARGV: '-ahu' '-F' 'files'
> Perl Version: 5.00502
> Namazu Version: 1.4.0.0-beta-8
> System: freebsd
> Time: 61998 sec.
> 
> とかやってます。333MHz(激遅)な環境での結果です。
> [namazu 575]や、[namazu 709]を見てみて下さい。

  はい。ありがとうございます。
  
  #って、過去メールの取り寄せって、どこのAddressにコントロールメッセージ
  #流せば良いのでしょう??

  とりあえず、このスペックのマシンで、この規模のファイル群の index が出来
  るという実例があったので、少し安心しました。  

> $REMAIN_HEADER = "From|Date|Message-ID|Newsgroups";
> $SEARCH_FIELD = 
"Message-Id|Subject|From|Date|Url|Newsgroups|To|X-Mailer|X-Newsreader";

  これは、News とか Mail ヘッダに関する記述ですね。
  ということは、今回はぼくのケースには関係ないみたいです。

> $ON_MEMORY_MAX   = 40000000;
> という変更を加えています。
> メモリ512Mなら、$ON_MEMORY_MAX はもっと大きくてもいいでしょう。

  なるほど。
  それでは、80000000 にしてみます。

> >>   ディレクトリツリー全部をいっぺんにつくろうとしてもだめなので、
> >>   ディレクトリツリーを少しずつ増やしては mknmzをかけ、またふやしては
> >>   mknmz をかけする作戦にでてみました。
> 
> で、どのあたりでどうダメなのでしょうか?
> もしかして、突然ハードウエアにリセットがかかるとか、perlがコアダンプ
> するとか?

  ハードウェアリセットはないのですが、Perl が core dump しています。
  ただ、これは私が、perlスクリプトの中から system で mknmz を呼んで
  いるので、大本の perl スクリプトが吐いているのかも知れません。
  
  まずはお教え頂いたパラメータをチューニングして、コマンドラインから
  一撃でindex作成してみます。
  
  


---

==================================================================
オムロンソフトウェア  株式会社  新事業開発部                _川ノ
                     畠田  喜丈                           ( ヽ ミ
                               hatada@xxxxxxxxxxx            ̄)(
=====提供するネットワークは物理層が伝書鳩で構成されています=======