Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: --html-split (namazu-bug#10)
>>>>> In [namazu-devel-ja : No.00421]
>>>>> "" = Satoru Takabayashi <satoru-t@xxxxxxxxxxxxxxxxxx> wrote:
> テストプログラムを作っているうちに、あれこれと問題が発覚しま
> した。強引に --html-split を導入したのは無理があったようです。
> 気づいた点については一通り修正しておきました。
> 考えていること:
> * ファイル? 文書?
> - 現在はこれらの概念がごっちゃになっている
> - 文書という概念に統一したい
> - ファイルでないものを平等に扱いたい
> * --html-split について
> - 汎用性のないオプション名である
> - 他の形式の文書も分割したくなるだろう
> - --doc-split にすればよかった
> - 動的に分割するのが厄介である。処理が複雑すぎる
Info 形式、Emacs の Rmail 形式、UNIX mbox 形式のようなものも
分割して mknmz できると嬉しいな。Namazu はそういう --doc-split
モジュールを切り替え可能な切口が用意されているだけでいいと思う。
HTML での実装があれば、他の人が他の形式に対応するのは容易と
なるような、そんな仕組みだと良いと思う。
;; Emacs で Info を検索、view できるようにしたいなぁ。
> * KAKASIの改造 (他力本願)
> - 短くわかち書き、長くわかち書き、両方を出力を切り替えたい
> - 例: 短く: 奈良 先端 科学 技術 大学院 大学
> 長く: 奈良先端科学技術大学院大学
> 両方: 奈良 先端 科学 技術 大学院 大学 奈良先端科学技術大学院大学
「わかち書き」も filter として実装すると切り替え可能だし、
> 両方: 奈良 先端 科学 技術 大学院 大学 奈良先端科学技術大学院大学
の実装もその filter に下請けに出してしまうとすっきりすると思
う。
> これらの問題を解決するには思いきった書き直しが必要です。いつ
> になったらやる気が起きるかな…。
mknmz 本体は骨組みだけの単純なものだといいかもしれません。
--
こせき @ Emacs のページ作成中
http://www.NetLaputa.ne.jp/~kose/Emacs/
kose@xxxxxxxxxxxxxxxxxx