TDSMTでは,学習文対から対訳単語と単語レベル文パターンを作成し,別の学習文対を照合することで,変換テーブルを作成する.変換テーブル作成までの手順を以下に示す.
- 手順1 対訳単語の作成
-
学習文対と対訳単語確率(IBM Model 1[9])を利用して,対訳単語を作成する.このとき付与される対訳単語確率を
1#1とする.
例として,表2.9に示す学習文対を使用して,表2.10に示す対訳単語を作成する.表2.10の値は例であり,実際の数値とは異なる.
表:
対訳単語作成に用いる学習文対
学習文対(日本語) |
彼は彼女が好きだ。 |
学習文対(英語) |
He likes her. |
表:
作成される対訳単語
|
日本語単語 |
英語単語 |
1#1 |
対訳単語1 |
彼 |
He |
0.4 |
対訳単語2 |
好き |
likes |
0.5 |
対訳単語3 |
彼女 |
her |
0.6 |
- 手順2 単語レベル文パターンの作成
-
学習文対内で対訳単語に当たる部分を変数化し,単語レベル文パターンを作成する.
例を表2.11に示す.
表:
単語レベル文パターンの作成例
学習文対(日本語) |
彼は彼女が好きだ。 |
学習文対(英語) |
He likes her. |
単語レベル文パターン(日本語) |
126#126は 127#127が 2#2だ。 |
単語レベル文パターン(英語) |
126#126 2#2 127#127 . |
- 手順3 変換テーブルの作成
-
学習文対と単語レベル文パターンを照合する.変数化した対訳単語と,変数に当たる対訳句を変換テーブルとする.
表2.12では変数 2#2の部分から変換テーブル“「得意」が「are good at」ならば「好き」は「likes」”が得られる.
表:
変換テーブルの作成例
学習文対(日本語) |
君は料理が得意だ。 |
学習文対(英語) |
You are good at cooking. |
単語レベル文パターン(日本語) |
126#126は 127#127が 2#2だ。 |
単語レベル文パターン(英語) |
126#126 2#2 127#127 . |
照合する学習文対(日本語) |
彼は彼女が好きだ。 |
照合する学習文対(英語) |
He likes her. |
変換テーブル2#2 |
A:得意 B:are good at |
|
C:好き D:likes |