学習の手順

TDSMTにおける学習は“変換テーブルの作成”のみである.本節で作成手順を示す.

手順1 対訳単語の作成

学習文対と対訳単語確率(IBM Model 1)を利用して, 対訳単語を作成する.このとき付与される対訳単語確率を87#87とする. 例として, 表2.1に示す学習文対を使用して, 表2.2に示す対訳単語を作成する.表2.2の値は例であり, 実際の数値とは異なる.


Table 2.1: 対訳単語作成に用いる学習文対
学習文対(日本語側) 彼の弟は学生だ。
学習文対(英語側) His brother is a student.


Table 2.2: 作成される対訳単語
  日本語単語 英語単語 88#88
対訳単語1 His 0.4
対訳単語2 brother 0.7
対訳単語3 学生 student 0.6

手順2 パターンの作成

学習文対内で対訳単語に当たる部分を変数化し, パターンを作成する. 例を表2.3に示す.


Table 2.3: パターンの作成例
学習文対(日本語側) 彼の兄は医者だ。
学習文対(英語側) His brother is a doctor.
パターン(日本語側) X0X1X2
パターン(英語側) X0 X1 is a X2

手順3 変換テーブルの作成

学習文対とパターンを照合する.変数化した対訳単語と, 変数に当たる対訳句を変換テーブルとする. 表2.4では変数N2の部分から変換テーブル“「学生」が「student」ならば「教師」は「teacher」”が得られる.


Table 2.4: 変換テーブルの作成例
学習文対(日本語側) 彼の弟は学生だ。
学習文対(英語側) His brother is a student.
パターン(日本語側) X0X1X2だ。
パターン(英語側) X0 X1 is a X2 .
照合する学習文対(日本語側) 私の母は教師だ。
照合する学習文対(英語側) My mother is a teacher.
変換テーブル(X2) A:学生 B:student
  C:教師 D:teacher

手順4 変換テーブルに確率を付与

対訳単語確率87#87を利用し, 変換テーブルに確率を付与する.この確率を変換テーブル確率89#89とする.
  1. 変換テーブルのCDに存在する全ての日英単語の組み合わせを確認する.
  2. 日本語単語に対応する英語単語の中で, 対訳単語確率87#87の最大値を得る.
  3. 各日本語単語について得られた値と, 変換テーブルのABの対訳単語確率87#87について, 対数の総和を求める.