Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: HTML ファイルで分野ごとに複合キーワ
- From: Fuminori Muranaga <bun@xxxxxxxxxxxxxxxxxxxxxxxx>
- Date: Mon, 22 Jul 2002 18:30:47 +0900
- X-ml-name: namazu-users-ja
- X-mail-count: 02737
- References: <C2C22FAF01D064fukumitu@segausers.gr.jp>
こんにちは、村永です。
#まだ、完全に解決したわけではありませんが、中間報告です。
福光さん曰く、
>mknmzで--html-splitのオブションを使用し、AのNAME属性単位に
>分割処理を行い
>http://www.namazu.org/doc/manual.html.ja#mknmz-option
>
>検索時には「商品名 △△顆粒」のように検索すれば
>ある程度は要望に沿えるのではないかと思います。
お返事ありがとうございました。
mknmzにそのようなオプションがあるとは知りませんでした。
教えていただいてから、いろいろ検索してみたら、過去にも同様の
メッセージがありました。大変失礼しました。
<A NAME>の利用法は、ご指摘の通りだと思います。
タグで囲んだほうが、mknmzが範囲を理解しやすいのではと
勝手に判断しました。
#考えてみれば、1つめの<A NAME>から、次の<A NAME>
#までを範囲とすればよいわけですね。
こちらのサーバで、実際に作業を行ってみました。
namazuのバージョンは2.0.6でしたが、ついでに2.0.10にあげてみました。
システム: mips-nec-sysv4.2MP(EWS4800/430EX)
Namazu: 2.0.10 , わかち書き: kakasi です。
#バージョンアップ後に、namazurcの「わかち書きシステム」を設定し忘れ、
#一時エラーに悩みました。
準備したhtmlファイルは、
-------------------------
<A name="k00100">◆◆◆◆◆◆《商品名》◆◆◆◆◆</A>
○○錠(2mg)
<A name="k00200">◆◆◆◆◆◆《一般名》◆◆◆◆◆</A>
塩酸○○○○○○,JAN
・・・・・
-------------------------
のように整形したものを、48個準備しました。
格納場所は、
/home/medinfo/public_html/didata2/DI/di03/di00003.html
のようにしております。
インデックスの作成は、
/home/medinfo/namazu/didata2
で、mknmzを以下のように実行してみました。
--------------------------
$ mknmz --html-split /home/medinfo/public_html/didata2/DI
検索対象のファイルを調べています...
48個のファイルがインデックス作成の対象として見つかりました
1/48 - /home/medinfo/public_html/didata2/DI/di01/di00101.html# [text/html]
1/21 - /home/medinfo/public_html/didata2/DI/di01/di00101.html#k00100 [text/html]
2/21 - /home/medinfo/public_html/didata2/DI/di01/di00101.html#k00108 [text/html]
3/21 - /home/medinfo/public_html/didata2/DI/di01/di00101.html#k00111 [text/html]
・・・・・
インデックスを書き出しています...
[基本]
日付: Mon Jul 22 18:24:56 2002
追加された文書の数: 961
サイズ (bytes): 285,019
合計の文書数: 961
追加キーワード数: 5,366
合計キーワード数: 5,366
わかち書き: kakasi
経過時間 (秒): 176
ファイル/秒: 5.46
システム: nec_ux
Perl: 5.006
Namazu: 2.0.10
--------------------------
#ここでは、うまくインデックスが作成されたように思えました。
現在、cgiから検索するところで少々悩んでおります。
htmlファイルに、以下のように記述すると、「<a name="k00100">」で
マークした部分だけヒットするだろうと考え、取り敢えず実行してみましたが、
---------------------------
<form method="get" action="/~medinfo/druginfo/bin/namazu.cgi">
<input type="text" name="query" size="100">
<input type="submit" name="submit" value="Search!">
<input type="hidden" name="idxname" value="k00100">
</form>
---------------------------
>検索結果
>参考ヒット数: [ (インデックスは古いフォーマットであるべきです) ]
となってしまいました。むむむ・・・・
#<input type="hidden" name="idxname" value="k00100">
#の行を抜いたら、検索がヒットすることは確認しました。
多分、インデックスの作成で何か失敗しているのでしょう。
なんとなく、もう一歩のようなところまできたような気がします。
もう少し、がんばってみます。
何か、お気づきの点がありましたら、ご教授下さい。
----
村永文学
鹿児島大学医学部附属病院 医療情報部
Fuminori Muranaga , Medical Informatics
TEL 099-275-5171 , FAX 099-275-5177