next up previous contents
次へ: 確率の付与 上へ: モデルの作成 戻る: b)対訳学習文における対数翻訳確率  ,   目次

c)対訳句抽出における対数翻訳確率 $ x_5$ ,$ x_6$

対訳句の抽出(2.4.4節a)において,対訳句は網羅的に抽出するため,多くの場合,同一の対訳句が複数抽出される.対訳句抽出における対数翻訳確率は対訳句を重複して抽出した回数を利用した確率である. なお,文生成に用いる対訳句は重複する対訳句がないように作成する. 対訳句抽出における日本語句$ j$ から句$ e$ への翻訳確率 $ P_{v}(e\vert j)$ は式(3.6)で求められる.

$\displaystyle P_{v}(e\vert j) = \frac{count_{v}(j,e)}{count_{v}(j)}$ (3.6)

ここで, $ count_{v}(j,e)$ は対訳句$ (j,e)$ を抽出した回数であり, $ count_{v}(j)$ は日本語句$ j$ を抽出した回数である.確率 $ P_{v}(e\vert j)$ の対数をとり,対訳句抽出における日英方向の対数翻訳確率とする. 同様に,対訳句抽出における英日方向の対数翻訳確率も求める.対訳句抽出における日英方向の対数翻訳確率の例を表3.2に示す.


表: 対訳句抽出における日英方向の対数翻訳確率の例
日本語句 英語句 $ count_{v}(j)$ $ count_{v}(j,e)$ $ \log(P_{v}(e\vert j))$
生まれ まし た was born 2233 104 -1.332
生活 の 複雑 さ complexity of human life 2718 124 -1.34
正比例 する are directly proportional 7761 20 -2.589



平成27年3月13日