次へ:
確率の付与
上へ:
モデルの作成
戻る:
b)対訳学習文における対数翻訳確率 ,
目次
c)対訳句抽出における対数翻訳確率
,
対訳句の抽出(
2.4.4
節a)において,対訳句は網羅的に抽出するため,多くの場合,同一の対訳句が複数抽出される.対訳句抽出における対数翻訳確率は対訳句を重複して抽出した回数を利用した確率である. なお,文生成に用いる対訳句は重複する対訳句がないように作成する. 対訳句抽出における日本語句
から句
への翻訳確率
は式(
3.6
)で求められる.
(3.6)
ここで,
は対訳句
を抽出した回数であり,
は日本語句
を抽出した回数である.確率
の対数をとり,対訳句抽出における日英方向の対数翻訳確率とする. 同様に,対訳句抽出における英日方向の対数翻訳確率も求める.対訳句抽出における日英方向の対数翻訳確率の例を表
3.2
に示す.
表:
対訳句抽出における日英方向の対数翻訳確率の例
日本語句
英語句
生まれ まし た
was born
2233
104
-1.332
生活 の 複雑 さ
complexity of human life
2718
124
-1.34
正比例 する
are directly proportional
7761
20
-2.589
平成27年3月13日