次へ: 対訳句の選別
上へ: 対訳句の選別方法
戻る: 対訳句の選別方法
目次
句の翻訳確率の付与
対訳句の選別には,対訳句の翻訳確率(以下,句の翻訳確率と表記)を利用する.句の翻訳確率の付与の手順を以下に示す.
- 手順1
- 対訳句において,日本語句の単語と英語句の単語の全ての組み合わせを得る.
- 手順2
- GIZA++を用いて,各組み合わせの対訳単語翻訳確率を得る.
- 手順3
- 各組み合わせの対訳単語翻訳確率の対数をとり,総和を求める.そして,総和の値を句の翻訳確率とする.なお,対訳単語翻訳確率が存在しない場合,ペナルティーとして-1000を付与する.
対訳句の例を表4.1に,対訳単語翻訳確率の例を表4.2に示す.
表:
対訳句の例
日本語句 |
彼 の 耳 |
英語句 |
his ear |
表:
対訳単語翻訳確率の例
日本語単語 |
英語単語 |
対訳単語翻訳確率 |
彼 |
his |
0.018 |
彼 |
ear |
- |
の |
his |
0.003 |
の |
ear |
0.001 |
耳 |
his |
0.001 |
耳 |
ear |
0.073 |
表4.1の句の翻訳確率を以下の式で求める.
上式と表4.2より,句の翻訳確率を求める.なお,表4.2より,``彼"と``ear"の対訳単語翻訳確率は存在しない.よって,ペナルティーとして-1000を付与する.表4.1の対訳句において,句の翻訳確率は-1037.884となる.
次へ: 対訳句の選別
上へ: 対訳句の選別方法
戻る: 対訳句の選別方法
目次
平成25年2月13日