SDIC形式は、grep などの行指向の検索プログラムを使って前方一致検索及び後 方一致検索、完全一致検索、全文検索が容易に行なえる構造になっている。
file := line* line := comment | entry comment := '#' [^\n]* '\n' entry := headword keyword* content '\n' headword := '<H>' word '</H>' | keyword keyword := '<K>' word '</K>' word := char+ char := [^<>&\n] | '<' | '>' | '&' content := string string := char_lf+ char_lf := char | '&lf;'
<H>go {動-1}</H><K>go</K>行くこの例では、見出し語にその語の品詞情報が含まれている。このような品詞情報 は、辞書の検索キーとして適当ではないので、検索時には対象としないようにし ておくのが適当だろう。 また、`<H>' と `<K>' を適当に選択することによって、辞書の検索 速度を低下させないようにすることができる。
<K>United Nations</K><K>united nations</K>国際連合というエントリがあったとする。この時、前方一致検索を行なうために `<K>united' をキーとして検索することを考える。行頭の文字列 `<K>United 〜' と検索キーは3文字目まで比較されるだろう。もしもあな たが、この辞書を検索する場合、つねにアルファベットの大文字と小文字の違い を無視して検索したいと考えているならば、この比較は無駄な比較である。 `<H>' を用いていれば、このような無駄な比較を避けることができる。し かし、この選択は、その辞書を検索するアプリケーションと検索を行なうプログ ラムの性質に依存する問題である。
前方一致検索 grep <K>study dictionary 後方一致検索 grep study</K> dictionary 完全一致検索 grep <K>study</K> dictionary
Go to the first, previous, next, last section, table of contents.