next up previous contents
Next: 類似度 Up: 提案手法2(Dice係数と類似度の積())を使用する手法 Previous: 提案手法2(Dice係数と類似度の積())を使用する手法   目次

Dice係数

Dice係数は頻度から計算する. Dice係数を式3.4に示す.
\begin{displaymath}
Dice(j,e)= \frac{2*count(j,e)}{count(j)+count(e)}
\end{displaymath} (3.4)

$count(j,e)$;日本語句$j$,英語句$e$が同じ対訳学習文において共起する頻度
$count(j)$;対訳学習文の日本語文に日本語句$j$が出現する頻度
$count(e)$;対訳学習文の英語文に英語句$e$が出現する頻度

日英の「この箱」と「this box」の共起頻度が4,「この箱」の出現する頻度が6,「this box」の出現する頻度が8の時の例を式3.5に示す.

$\displaystyle Dice(この箱,this box)$ $\textstyle =$ $\displaystyle \frac{2count(この箱,this\ box)}{count(この箱)+count(this\ box)}$ (3.5)
  $\textstyle =$ $\displaystyle \frac{4}{6+8}=0.28$  



2018-03-06