Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: 独自フィルタでの問題
橋本です。
少し調べてみると、以下のようなエラーが出るようになりました。
-----
[webadmin@mamo contrib]$ mknmz --output-dir="/var/namazu/index/swatch-ml" /var/s
pool/ml/watch-ml/htdocs/20010630
3個のファイルがインデックス作成の対象として見つかりました
1/3 - /var/spool/ml/watch-ml/htdocs/20010630/3.html [text/html]
/usr/share/kakasi/kanwadict: そのようなファイルやディレクトリはありません
2/3 - /var/spool/ml/watch-ml/htdocs/20010630/index.html [text/html]
/usr/share/kakasi/kanwadict: そのようなファイルやディレクトリはありません
3/3 - /var/spool/ml/watch-ml/htdocs/20010630/thread.html [text/html]
/usr/share/kakasi/kanwadict: そのようなファイルやディレクトリはありません
[基本]
日付: Sun Jul 1 17:58:19 2001
追加された文書の数: 3
サイズ (bytes): 3,080
合計の文書数: 3
わかち書き: /usr/bin/kakasi -ieuc -oeuc -w
経過時間 (秒): 4
ファイル/秒: 0.75
システム: linux
Perl: 5.006
Namazu: 2.0.4
-----
どうも、kakasiのバイナリ辞書ファイルがないといっているようです。
kakasiの辞書ファイルを作成しないとだめなのでしょうか?
ちなみに、別途kakasiのインストールはしておらず、namazu-2.0.4.rpmを入れた
時に一緒に入ったようです。(RedHat7.0.1J)
さらに、kakasidictファイル(テキスト)も存在していません。
On Sun, 01 Jul 2001 17:35:41 +0900
mamoru hashimoto <mamo@xxxxxxxxxxxxxxxxxx> wrote:
> 橋本です。
>
> -----
> sub mediatype() {
> return ('text/html; x-type=fmlhtml');
> }
> -----
>
> のようになっており、このfmlhtml.plフィルタは以前、同じバージョンの
> namazu-2.0.4で動いていました。
>
> 違いがあるとすれば、perlのバージョンが、5.0003→5.6.0になったくらいなの
> で、単なる設定ミスのような気がします。
>
> ただ、気になるのは、
>
> 1、filterとしての登録は、/usr/share/namazu/filterへのコピーだけでよいの
> か?(namazuインストールの仕方にもよりますが・・・)
>
> 2、filterタイプの指定は、mknmzrcには、必要ないのか?
>
> 以下、実際に動かしたshellスクリプトです。参考になるでしょうか?
>
> -----
> #!/bin/sh
> #
> NMZ=/usr/bin/mknmz
> OUT=/var/namazu/index
> INP=/var/spool/ml
> CFG=/var/webadmin/NOC/contrib/.mknmzrc
>
> ##############################
> ### Create Watch index
> ##############################
> for dir in $INP/watch-ml/htdocs/*
> do
> if [ -d $dir ] ; then
> echo $dir
> $NMZ --no-delete --media-type='text/html; x-type=fmlhtml' \
> --output-dir="$OUT/watch-ml" --config="$CFG" $dir
> fi
> done
> -----
>
> On Sun, 01 Jul 2001 17:19:18 +0900
> HIROSE Yoshihide <yoshihide@xxxxxxxxxx> wrote:
>
> > 廣瀬と申します。
> >
> > At Sun, 01 Jul 2001 13:37:00 +0900,
> > mamoru hashimoto wrote:
> >
> > > 独自のフィルタを作成して、fmlhtml.plでfml→html化したものをインデックス
> > > 化するというものです。
> > >
> > > 未対応の形式と出力されているので、フィルタが認識されていないのかと思うの
> > > ですが、mknmz -Cではちゃんと出力されているようです。
> >
> > こういうときは、実際に作成されたフィルタを見せてもらうのが
> > 手っ取り早いのですが。
> >
> > > 1/1 - /var/spool/ml/watch-ml/htdocs/20010630/3.html 未対応の形式 (=text/html; x-type=fmlhtml)無視します
> >
> > ここの(=text/html; x-type=fmlhtml)が怪しい気がします。
> > 作成されたフィルタではmediatype()を正しく返していますか?
> >
> > で、ぼくもfmlのhtmlをちょっと見てみたのですが、単純にindex,thread等をインデクス対象から
> > はずすだけで良さそうなので、自作するなら filter/mhonarc.plを修正するのが簡単で良いと思います。
> >
> > # ためしにやってみましたが、それなりに動くようです。
> >
> > sd3 47% mknmz --media-type='text/html; x-type=fmlhtml' ../htdocs/
> > 検索対象のファイルを調べています...
> > 78個のファイルがインデックス作成の対象として見つかりました
> > 1/78 - /usr/people/hirose/fml/index/../htdocs/1000/1092.html [text/html; x-type=fmlhtml]
> > [snip]
> > 72/76 - /usr/people/hirose/fml/index/../htdocs/1100/1163.html [text/html; x-type=fmlhtml]
> > 73/76 - /usr/people/hirose/fml/index/../htdocs/1100/index.html is FML's index file! skipped.
> > 73/75 - /usr/people/hirose/fml/index/../htdocs/1100/thread.html is FML's index file! skipped.
> > 73/74 - /usr/people/hirose/fml/index/../htdocs/index.html is FML's index file! skipped.
> > 73/73 - /usr/people/hirose/fml/index/../htdocs/thread.html is FML's index file! skipped.
> > インデックスを書き出しています...
> > [基本]
> > 日付: Sun Jul 1 17:11:34 2001
> > 追加された文書の数: 72
> > サイズ (bytes): 201,909
> > 合計の文書数: 72
> > 追加キーワード数: 5,030
> > 合計キーワード数: 5,030
> > わかち書き: module_kakasi -ieuc -oeuc -w
> > 経過時間 (秒): 18
> > ファイル/秒: 4.00
> > システム: irix
> > Perl: 5.00503
> > Namazu: 2.0.5
>
>