Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: --html-split (namazu-bug#10)



>>>>> In [namazu-devel-ja : No.00421] 
>>>>> "" = Satoru Takabayashi <satoru-t@xxxxxxxxxxxxxxxxxx> wrote:
> テストプログラムを作っているうちに、あれこれと問題が発覚しま
> した。強引に --html-split を導入したのは無理があったようです。
> 気づいた点については一通り修正しておきました。

> 考えていること:

>   * ファイル? 文書?
>     - 現在はこれらの概念がごっちゃになっている
>     - 文書という概念に統一したい 
>     - ファイルでないものを平等に扱いたい

>   * --html-split について
>     - 汎用性のないオプション名である
>     - 他の形式の文書も分割したくなるだろう
>     - --doc-split にすればよかった
>     - 動的に分割するのが厄介である。処理が複雑すぎる

Info 形式、Emacs の Rmail 形式、UNIX mbox 形式のようなものも
分割して mknmz できると嬉しいな。Namazu はそういう --doc-split 
モジュールを切り替え可能な切口が用意されているだけでいいと思う。

HTML での実装があれば、他の人が他の形式に対応するのは容易と
なるような、そんな仕組みだと良いと思う。

;; Emacs で Info を検索、view できるようにしたいなぁ。

>   * KAKASIの改造 (他力本願)
>     - 短くわかち書き、長くわかち書き、両方を出力を切り替えたい
>       - 例: 短く: 奈良 先端 科学 技術 大学院 大学
>             長く: 奈良先端科学技術大学院大学
>             両方: 奈良 先端 科学 技術 大学院 大学 奈良先端科学技術大学院大学

「わかち書き」も filter として実装すると切り替え可能だし、

>             両方: 奈良 先端 科学 技術 大学院 大学 奈良先端科学技術大学院大学

の実装もその filter に下請けに出してしまうとすっきりすると思
う。

> これらの問題を解決するには思いきった書き直しが必要です。いつ
> になったらやる気が起きるかな…。

mknmz 本体は骨組みだけの単純なものだといいかもしれません。
-- 
こせき @ Emacs のページ作成中
http://www.NetLaputa.ne.jp/~kose/Emacs/
kose@xxxxxxxxxxxxxxxxxx