Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
ミラーリング時の更新時刻保持について
- From: Tetsuo Inaba <tet@xxxxxxxxxxxx>
- Date: Mon, 08 May 2000 15:33:13 +0900
- X-ml-name: namazu-users-ja
- X-mail-count: 00373
因幡@武蔵大と申します。
現在、以下のようなサーチエンジンをNamazu-2.04 + wget-1.5.3で作成しようと
奮闘しています。
1.事前に承諾をもらっているWebサイトをwgetでミラーリング
2.mknmzでインデックス化
3.namazuで検索
ここで、一つ問題が発生してしまいました。
wgetでミラーリングする際、タイムスタンプが取得時刻になってしまうため、
Namazuの出力時、日付でのソートが出来なかったり、不正な(ミラーリング元の更
新時刻とは異なる)日付が出力されたりで困っています。
Namazuの問題というよりはwgetの問題(私が使い方を知らないだけ)という気もす
るのですが、このMLであれば同様の使い方をされている方もいらっしゃるかと思
い、こちらに投稿させていただきました。
解決のためのポインタなど、ご指摘いただければ幸いです。
なお、現在cronで実行させているコマンドは以下の通りです。
#ミラーリング
00 22 * * * wget -b -m http://www.tk.airnet.ne.jp/tet/index.html -A
*.htm*,*.shtm* -P /home/tet/mirror/tet
#インデックス作成
45 22 * * * mknmz -O /home/tet/index/tet /home/tet/mirror/tet
※ディレクトリ名などは架空のものです
=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
因幡哲男 (Tetsuo Inaba)
tet@xxxxxxxxxxxx
http://www.tk.airnet.ne.jp/tet
=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=