namazu-dev(ring)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

handling a meta tag (Re: kwnmz)



Rei FURUKAWA <furukawa@xxxxxxxxxxxxxxxx> wrote:

>satoru-t> # 付加するキーワードは tf idf法を用いて選出したい (meta
>satoru-t> # name="keywords" ...> があればそれを使った方がよい) ところ
>
>という話がありましたが、kwnmz では、元ファイルを読むことをしていないの
>で、meta タグには対応できません。これは、mknmz の中でやる必要があります。

2,3日前に、ドイツの人から「自分は meta tag をたくさん含んだ 
HTMLファイルを持っているんだけど、 Namazuは meta tag を扱え
るか?」なるメイルが届きました。

どんな meta tag なのか訊いたところ、

  <META NAME="HDR_SACHGEB" CONTENT="Zivilrecht">
  <META NAME="HDR_GATTUNG" CONTENT="Entscheidungssammlung">
  <META NAME="HDR_DOKART" CONTENT="Rechtsprechung">

といった meta tag を扱いたいとのことでした。

というわけで、この手の meta tag を扱えるように mknmz を拡張
しました。 --meta オプションをつけてインデックスを作成すると、

  $conf::$META_TAGS = 'keywords|description';

に従って、 NMZ.field.* を作成します。(この例では
NMZ.field.keywords, NMZ.fields.description)

つまり、

  <META NAME="HDR_SACHGEB" CONTENT="Zivilrecht">
  <META NAME="HDR_GATTUNG" CONTENT="Entscheidungssammlung">
  <META NAME="HDR_DOKART" CONTENT="Rechtsprechung">

なら、

  $conf::META_TAGS = "HDR_SACHGEB|HDR_GATTUNG|HDR_DOKART";

です。なお、 $conf::META_TAGS の設定は ~/.mknmzrc で行なえま
す。($conf::META_TAGS に限らず変数ならなんでも ~/.mknmzrc で
設定できます)

-- Satoru Takabayashi