Namazu-users-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

title と TITLE タグの違いによる mknmz の処理の違いについて



壺井@和歌山大学です。
webを収集して、indexingしているのですが、
webのHTMLが
<title>のものと<TITLE>のものがあります。
mknmzでindexingすると
<TITLE>となっているものは、namazu,cgiでタイトルがでるのですが
<title>となっているものは、タイトルではなく
ファイルの名前でタイトルが表示されてしまいます。
(ex hoge.htmlと言った感じになります。)
ファイル名にならないようにするには どうすればよいのでしょうか?
ご指導よろしくお願いします。

Date:                Fri Feb 22 00:06:15 2002
Added Documents:     2,877
Updated Documents:   1,928
Size (bytes):        40,709,294
Total Documents:     9,623
Added Keywords:      118,056
Total Keywords:      270,959
Wakati:              module_kakasi -ieuc -oeuc -w
Time (sec):          543
File/Sec:            8.85
System:              freebsd
Perl:                5.00503
Namazu:              2.0.10

追記
以前に投稿した 400G…は、フォルダを分割して
何とか対処できるようになりました。
あと、prnmzを試してみましたが、収束しませんでした。
アドバイスありがとうございました。