Namazu-devel-ja(旧)


[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [Q] Any TIPS about wakatizing and indexing?



石橋"rubyholic"秀仁です。
Osamu Okano さん、ありがとうございます。

From: Osamu Okano <osamu2001@xxxxxxxxxxxx>
Subject: [namazu-devel-ja] Re: [Q] Any TIPS about wakatizing and indexing?

> 答えとしては「素直に index を作っている」です。
> 逆にそうじゃないと不都合がある場合があります。
> 
> >このように、「は」「☆」「で」「す」など、ふつうは役に立たない
> >ようなものも含まれます。
> 単純な話この部分を捨てちゃったら
> { オブジェクト 指向 スクリプト 言語 ☆ で す 。}
> という文章中に存在するはずのフレーズで検索
> (こういう順番で語が出現する文章を検索するという意味)
> できなくなってしまいます。
> これがあると無いとでは検索の結果の質が結構変わります。
> (より狙ったとおりの検索結果が得られる)
> 「つのだ☆ひろ」とか

「春はあけぼの」の「は」とかですね。

> 現在は品詞情報の利用としては名詞だけのようです。
> 品詞の取捨選択を本格的にやるとしたら
> 捨てるというより重みを適切に調節すればより質のよい
> 検索結果が得られるものと思います。

重みは 0 から与えることができるので、
重みの調節だけで解決できるということですね。
いわれてみればその通りです (^^;

納得できました。ありがとうございます。

--
Hideto "rubyholic" ISHIBASHI
http://www.rr.iij4u.or.jp/~hideto-i/
blade clone (yaiba) development:
http://www.rr.iij4u.or.jp/~hideto-i/rb/yaiba/index.html