提案手法の問題点

提案手法では,誤っているが対訳単語確率が高い対訳句を削除することができる.しかし,対訳句の削除を行う前に誤っている対訳句が存在しない場合,より正しい対訳句を削除する場合がある.例として3つの学習文対を表5.4,表5.5に示す.
表: 学習文対と単語レベル文パターンの例7
学習文対(日本語) 私はペンを取る。
学習文対(英語) I take the pen.
単語レベル文パターン(日本語) 126#126127#1272#2
単語レベル文パターン(英語) 126#126 2#2 127#127 .


表: 学習文対と単語レベル文パターンの例8
学習文対(日本語) 彼はそれを取る。
学習文対(英語) He takes it.
単語レベル文パターン(日本語) 126#126127#1272#2
単語レベル文パターン(英語) 126#126 2#2 127#127 .

また,表5.6,表5.7に2つの学習文対の対訳句と対訳単語確率の例を示す.


表: 対訳句と変数確率の例10
対訳句の変数 日本語句 英語句 1#1 3#3
126#126 I 0.4 1.1
2#2 取る take 0.6 0.9
127#127 ペン the pen 0.5 1.0


表: 対訳句と変数確率の例11
対訳句の変数 日本語句 英語句 1#1 3#3
126#126 He 0.4 1.1
2#2 取る takes 0.5 1.0
127#127 それ it 0.6 0.9

5.4,表5.5は単語レベル文パターンが一致している.また,2#2について日本語句「取る」に対して異なる英語句を用いて表現されている.この2つの対訳句を 3#3の値が高い順番で順位を決定し,順位が128#128位以下の対訳句を削除する.ここでは128#128=2とする.それぞれの変数確率とその順位を表5.8に示す.


表: 各学習文対の対訳句2#2の変数確率とその順位4
日本語句 英語句 1#1 1#1の順位 3#3 3#3の順位
取る take 0.6 1 0.9 2
取る takes 0.5 2 1.0 1

対訳句「取る」「take」は 1#1を用いた順位では1位となるが, 3#3を用いた順位では2位となり削除される. 一方で,対訳句「取る」「takes」は 1#1を用いた順位では2位であるが, 3#3を用いた順位では1位となる. このように提案手法を用いることで,より正しい対訳句が削除される場合がある.