Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: ms-word ドキュメントのヘッダ、フッタは検索対象になるのか
Amuro Rayです。
その後の疑問です。
そもそも、mknmzによるインデックスの作成は、どのように行
われているのでしょうか?
nkf、KAKASIの説明はよくあるのですが、mknmzの挙動って見た
ところ余り紹介されていないようで、ヘッダ、フッタの情報が
どの時点で切り捨てられているのか、見当がつかないのです。
推測なんですが、
mknmz
↓
filter対象チェック(どうなっているかわかりません。)
↓
対象filterプログラム処理
↓
検索対象ファイルを全てHTMLにする!?
↓
nkfコード変換!?
↓
分かち書き
↓
インデックスファイルに保存
のような順番でしょうか?
filter以下ディレクトリを見てみましたが、検索対象ファイル
のチェックや、フィルタ処理などはPerlを知らないので、特に
見当がつかないです。とほほ。
"★。、::。.::・'゜☆。.::・'゜★。、::。.::・'゜
Name : Amuro Ray
E-Mail : gundam@xxxxxxxxxxxxxxxx
"★。、::。.::・'゜☆。.::・'゜★。、::。.::・'゜