Namazu-users-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: kakasi の辞書のメンテナンス方法
金平と申します。
アドバイスありがとうございました。
再度質問させて下さい。
>> 自動で行なう方法は今のところありません。
>> 先日行なわれた ITX 2002 Summer <http://www.ipa.go.jp/itx2002/summer/>
>> にて、「未知語を対象にしたキーワード抽出とシソーラス構築アルゴリズム」
>> という展示をしている方はいました。技術的には不可能ではないようです。
>> # 残念ながら、その方の成果はオープンソースにしているわけではありません
>> # でしたが... 論文発表はされているようです。
kakasiの辞書に存在しない単語が、インデックス作成対象ファイル
にあった場合の、kakasiの辞書への登録方法です。
「自動で行う方法はない」とアドバイスを頂きましたが、、
手動で行う方法について教えていただけたらと思います。
インデックス作成時に、”辞書にない単語”があった場合に
どこかのファイルに”辞書にない単語”が書き出される
ということはないのでしょうか?
そうすれば、辞書のメンテナンスを行う時に、
そのファイル(辞書未登録単語)を参照して、
kakasidictへ追加することによりメンテナンス
が容易になると思うのですが。
私が考える辞書のメンテナンス方法は、
新しくアップロードするファイルの単語を全てなめて、
kakasidictに登録されているかどうか
一つ一つ検索していく方法しか思いあたらないのですが。
この方法だとすごく手間がかかります。
”辞書にない単語”が分かる方法はありませんでしょうか?
どうか宜しくお願いします。