次へ:
ブログからの長所情報の抽出
上へ:
分類で用いる技術
戻る:
用言の意味解析
目次
単語(名詞)の特徴度
文書検索における関数に,Okapi BM25がある.Okapi BM25は,複数のキーワード から成る検索クエリ
に対して,文書のスコアを出す関数である[
8
]. 文書
とキーワード
とによるスコア
は,次の式で求める.
(2.1)
(2.2)
(2.3)
ここで,
は
における
の出現頻度,
は
を含む文書数,
は文書
の長さ,
は全文書における平均長,
は全文書数である.
と
は,定数である.
平成23年3月1日