namazu-dev(ring)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
handling a meta tag (Re: kwnmz)
Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx> wrote:
>satoru-t> # 付加するキーワードは tf idf法を用いて選出したい (meta
>satoru-t> # name="keywords" ...> があればそれを使った方がよい) ところ
>
>という話がありましたが、kwnmz では、元ファイルを読むことをしていないの
>で、meta タグには対応できません。これは、mknmz の中でやる必要があります。
2,3日前に、ドイツの人から「自分は meta tag をたくさん含んだ
HTMLファイルを持っているんだけど、 Namazuは meta tag を扱え
るか?」なるメイルが届きました。
どんな meta tag なのか訊いたところ、
<META NAME="HDR_SACHGEB" CONTENT="Zivilrecht">
<META NAME="HDR_GATTUNG" CONTENT="Entscheidungssammlung">
<META NAME="HDR_DOKART" CONTENT="Rechtsprechung">
といった meta tag を扱いたいとのことでした。
というわけで、この手の meta tag を扱えるように mknmz を拡張
しました。 --meta オプションをつけてインデックスを作成すると、
$conf::$META_TAGS = 'keywords|description';
に従って、 NMZ.field.* を作成します。(この例では
NMZ.field.keywords, NMZ.fields.description)
つまり、
<META NAME="HDR_SACHGEB" CONTENT="Zivilrecht">
<META NAME="HDR_GATTUNG" CONTENT="Entscheidungssammlung">
<META NAME="HDR_DOKART" CONTENT="Rechtsprechung">
なら、
$conf::META_TAGS = "HDR_SACHGEB|HDR_GATTUNG|HDR_DOKART";
です。なお、 $conf::META_TAGS の設定は ~/.mknmzrc で行なえま
す。($conf::META_TAGS に限らず変数ならなんでも ~/.mknmzrc で
設定できます)
-- Satoru Takabayashi