変換テーブル作成の手順

TDSMTでは,学習文対から対訳単語と単語レベル文パターンを作成し,別の学習文対を照合することで,変換テーブルを作成する.変換テーブル作成までの手順を以下に示す.

手順1 対訳単語の作成

  学習文対と対訳単語確率(IBM Model 1[9])を利用して,対訳単語を作成する.このとき付与される対訳単語確率を 1#1とする. 例として,表2.9に示す学習文対を使用して,表2.10に示す対訳単語を作成する.表2.10の値は例であり,実際の数値とは異なる.


表: 対訳単語作成に用いる学習文対
学習文対(日本語) 彼は彼女が好きだ。
学習文対(英語) He likes her.


表: 作成される対訳単語
  日本語単語 英語単語 1#1
対訳単語1 He 0.4
対訳単語2 好き likes 0.5
対訳単語3 彼女 her 0.6

手順2 単語レベル文パターンの作成

  学習文対内で対訳単語に当たる部分を変数化し,単語レベル文パターンを作成する. 例を表2.11に示す.


表: 単語レベル文パターンの作成例
学習文対(日本語) 彼は彼女が好きだ。
学習文対(英語) He likes her.
単語レベル文パターン(日本語) 126#126127#1272#2だ。
単語レベル文パターン(英語) 126#126 2#2 127#127 .

手順3 変換テーブルの作成

  学習文対と単語レベル文パターンを照合する.変数化した対訳単語と,変数に当たる対訳句を変換テーブルとする. 表2.12では変数 2#2の部分から変換テーブル“「得意」が「are good at」ならば「好き」は「likes」”が得られる.


表: 変換テーブルの作成例
学習文対(日本語) 君は料理が得意だ。
学習文対(英語) You are good at cooking.
単語レベル文パターン(日本語) 126#126127#1272#2だ。
単語レベル文パターン(英語) 126#126 2#2 127#127 .
照合する学習文対(日本語) 彼は彼女が好きだ。
照合する学習文対(英語) He likes her.
変換テーブル2#2 A:得意 B:are good at
  C:好き D:likes