Namazu-devel-ja(旧)
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: phrase search
皆様はじめまして,
鈴木@名古屋大と申します.
数週間前からMLに参加させていただいております.
> 現在の、ハッシュ値を用いた手法をやめて、出現位置を普通に記録
> する方法に変えた方がいいような気がしてきました。
まさにこのこと関連して,質問したいと思っておりました.
現在コーパスと呼ばれるテキストの語学資料から
任意のキーワードを含むテキストファイルを検索する仕組み
にNamazuを利用させていただいています.
しかし,検索システムの目的として,
検索結果に「マッチした付近のテキスト」を含める必要があり,
Namazuでヒットしたファイルについて改めてキーワードでGrep検索するという
効率の悪い方法をとっているため,検索に時間がかかってしまっています.
そこで,インデックスファイルに出現位置情報があれば
よりはやく検索結果を出せるのではと思っていたのですが,
技量不足で自力で解決するのは難しく,どうしようかと
思っていたところでした.
以上のような事情から,
インデックスファイルに出現位置情報が含められれば
大きな恩恵を受けられそうなので,ぜひ期待したいと思います.
------------------------------
鈴木麗璽 -Reiji SUZUKI-
名古屋大学 大学院人間情報学研究科 AL-Lab.
reiji@xxxxxxxxxxxxxxxxxxxxxxxxx