next up previous contents
次へ: Okapi BM25対応付け例 上へ: 文章中の内容語の利用: 戻る: 文章中の内容語の利用:   目次

判定方法

本研究では,各名詞ごとのスコアを利用するため,式2.2で示したOkapi-BM25の要素である式2.3を用いてコメント先の解析を行う. コメント元のブロックを $ B_s$ ,コメント先の候補となるブロックの集合を $ C$ , ブロック $ B$ に含まれる名詞の集合を返す関数を $ \mathit{nouns}( B )$ とする. このとき,コメント先のブロック $ \tilde{B_d}$ は,式 3.1で求める.
$\displaystyle \tilde{B_d} = \mathop{\mathrm{arg~max}}\limits _{\substack{B_d \in C\\ q \in \mathit{nouns}( B_s )}} s_{\mathit{BM25}}(B_d,q)$     (3.1)

ただし, $ s_{\mathit{BM25}}(B,q)$ が同点の場合,$ C$ にて先に現われたもの,すなわち, ブログ記事において,本文部やコメント部のはじめの方を優先する. また,Okapi-BM25 における全文書集合は, $ C \cup { B_s } $ とする.

平成23年4月13日