namazu-ml(ring)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
RE: [namazu 1262] インデックス対象外にするには?
- From: "Totsuka Ryutaro" <totsuka@xxxxxxxxxx>
- Date: Thu, 13 Jan 2000 17:32:32 +0700
初めてお便りします。
インドネシア在住の戸塚と申します。
インドネシア在住の有志で「よろずインドネシア」という
掲示板を運営しています。
インドネシアについての同様の質問等が多く、mamazu
を利用させて頂き、インデックスを作成して、先ずは
過去ログの検索をして頂くようお願いしています。
>HTMLファイルを mknmz をする時に、ある単語を
>インデックス対象外にする方法はないのでしょうか?
実は、私もこの問題で悩みました。
私どもの過去ログにも、おっしゃるように定型文が付与
されたり、自動処理のためのタグが多くこれを削除して
みました。
私共の削除目的は、もう一つ、賃借しているサーバー
スペース削減で、今回、年末年始休みを利用して徹底
削除を試みました。
投稿本文からは、定型文(不要分)とフォローアップの
日付、時刻、自動処理用タグを外し、容量的には
40%程の削減になりました。
また、インデックス用元ファイルでは、titleは残しました
が、次のtitleと同じ標題やら、各種改行コード、全角
スペース、半角スペースx2等々を取り除きました。
これにより、ひらがな、カタカナの検索スピードが上が
ったように思っています。ただ、インデックスファイル容量
の削減率は、思った程上がらず、十数パーセントで、
結果は、元ファイルよりも、インデックスファイルの容量
の方が大きくなってしまいました。
この削除のためのソフトには、textSSを使っています。
↓は作者のホームページです。
http://www.yamashita-y.tis.ne.jp/atelier/
namazuと同様に使い勝手の良いソフトです。
また、私共の掲示板は、
http://yorozu.indosite.org/index.shtml
検索のページは、
http://yorozu.indosite.org/search/
です。覗いて頂ければ幸いです。
戸塚龍太郎
PT Intechsys Trisatya
Jakarta, Indonesia