TDPBSMTにおける学習は「変換テーブルの作成」と「文パターンの作成」である.
本節で作成手順を示す.
- 手順1 変換テーブルを作成
-
TDSMTと同様の方法で変換テーブルを作成する.
- 手順2 変換テーブルを分割
-
変換テーブルを変換テーブル130#130と変換テーブル1#1に分割する.表3.1では3つの変換テーブルを分割している.
Table:
変換テーブルの分割
変換テーブル130#1301 |
A : 振幅 B : amplitude |
変換テーブル1#11 |
C : 数値 D : value |
変換テーブル130#1302 |
A : 大きくな B : increased |
変換テーブル1#12 |
C : 走る D : run |
変換テーブル130#1303 |
A : 大きくな B : grow |
変換テーブル1#13 |
C : 小さくな D : was small |
- 手順3 文パターンを作成
-
学習文対の,変換テーブル130#130に当たる単語を変数化し,文パターンを作成する.
表3.2では2つの対訳単語を変数に置き換えている.
Table:
文パターンの作成例
|
日本語側 |
英語側 |
学習文対 |
その振幅は大きくなった。 |
The amplitude increased. |
変換テーブル130#1301 |
A : 振幅 |
B : amplitude |
変換テーブル130#1302 |
A : 大きくな |
B : increased |
作成される文パターン |
そのX0はX1った。 |
The X0 X1. |
- 手順4 文パターンに確率を付与
-
対訳単語確率124#124を利用して,文パターンに確率を付与する.この確率を文パターン確率131#131とする.以下にその手順を示す.
- 文パターンに存在する全ての日英単語の組み合わせを確認する.
- 日本語単語に対応する英語単語の中で,対訳単語確率124#124の最大値を得る.
- 各日本語単語について得られた値について,対数の総和を求める.