学習の手順

TDPBSMTにおける学習は「変換テーブルの作成」と「文パターンの作成」である. 本節で作成手順を示す.

手順1 変換テーブルを作成

 TDSMTと同様の方法で変換テーブルを作成する.

手順2 変換テーブルを分割

 変換テーブルを変換テーブル130#130と変換テーブル1#1に分割する.表3.1では3つの変換テーブルを分割している.


Table: 変換テーブルの分割
変換テーブル130#1301 A : 振幅   B : amplitude
変換テーブル1#11 C : 数値   D : value
変換テーブル130#1302 A : 大きくな B : increased
変換テーブル1#12 C : 走る   D : run
変換テーブル130#1303 A : 大きくな B : grow
変換テーブル1#13 C : 小さくな D : was small

手順3 文パターンを作成

 学習文対の,変換テーブル130#130に当たる単語を変数化し,文パターンを作成する. 表3.2では2つの対訳単語を変数に置き換えている.


Table: 文パターンの作成例
  日本語側 英語側
学習文対 その振幅は大きくなった。 The amplitude increased.
変換テーブル130#1301 A : 振幅 B : amplitude
変換テーブル130#1302 A : 大きくな B : increased
作成される文パターン そのX0X1った。 The X0 X1.

手順4 文パターンに確率を付与

 対訳単語確率124#124を利用して,文パターンに確率を付与する.この確率を文パターン確率131#131とする.以下にその手順を示す.

  1. 文パターンに存在する全ての日英単語の組み合わせを確認する.
  2. 日本語単語に対応する英語単語の中で,対訳単語確率124#124の最大値を得る.
  3. 各日本語単語について得られた値について,対数の総和を求める.