next up previous contents
次へ: 対訳句の選別 上へ: 対訳句の選別方法 戻る: 対訳句の選別方法   目次


句の翻訳確率の付与

対訳句の選別には,対訳句の翻訳確率(以下,句の翻訳確率と表記)を利用する.句の翻訳確率の付与の手順を以下に示す.
手順1
対訳句において,日本語句の単語と英語句の単語の全ての組み合わせを得る.
手順2
GIZA++を用いて,各組み合わせの対訳単語翻訳確率を得る.
手順3
各組み合わせの対訳単語翻訳確率の対数をとり,総和を求める.そして,総和の値を句の翻訳確率とする.なお,対訳単語翻訳確率が存在しない場合,ペナルティーとして-1000を付与する.
対訳句の例を表4.1に,対訳単語翻訳確率の例を表4.2に示す.


表: 対訳句の例
日本語句 彼 の 耳
英語句 his ear


表: 対訳単語翻訳確率の例
日本語単語 英語単語 対訳単語翻訳確率
his 0.018
ear -
his 0.003
ear 0.001
his 0.001
ear 0.073

4.1の句の翻訳確率を以下の式で求める.


$\displaystyle 句の翻訳確率$ $\displaystyle =$ $\displaystyle \log_{2}(\lq\lq 彼''と\lq\lq {\rm his}''の対訳単語翻訳確率)$  
  $\displaystyle +$ $\displaystyle \log_{2}(\lq\lq 彼''と\lq\lq {\rm ear}''の対訳単語翻訳確率)$  
  $\displaystyle +$ $\displaystyle \log_{2}(\lq\lq の''と\lq\lq {\rm his}''の対訳単語翻訳確率)$  
  $\displaystyle +$ $\displaystyle \log_{2}(\lq\lq の''と\lq\lq {\rm ear}''の対訳単語翻訳確率)$  
  $\displaystyle +$ $\displaystyle \log_{2}(\lq\lq 耳''と\lq\lq {\rm his}''の対訳単語翻訳確率)$  
  $\displaystyle +$ $\displaystyle \log_{2}(\lq\lq 耳''と\lq\lq {\rm ear}''の対訳単語翻訳確率)$  

上式と表4.2より,句の翻訳確率を求める.なお,表4.2より,``彼"と``ear"の対訳単語翻訳確率は存在しない.よって,ペナルティーとして-1000を付与する.表4.1の対訳句において,句の翻訳確率は-1037.884となる.


next up previous contents
次へ: 対訳句の選別 上へ: 対訳句の選別方法 戻る: 対訳句の選別方法   目次
平成25年2月13日