問題点

対訳句を削除した後,対訳単語確率は高いが誤っている対訳句が存在する.例として3つの学習文対を表2.20,表2.21,表2.22に示す.表2.20,表2.22はそれぞれ表2.13,表2.15と同じ学習文対である.また,表2.21は対訳単語確率は高いが誤った対訳句が存在する学習文対である.


表: 学習文対と単語レベル文パターンの例4
学習文対(日本語) 彼は彼女が好きだ。
学習文対(英語) He likes her.
単語レベル文パターン(日本語) 126#126127#1272#2だ。
単語レベル文パターン(英語) 126#126 2#2 127#127 .


表: 学習文対と単語レベル文パターンの例5
学習文対(日本語) 彼は旅行が好きだ。
学習文対(英語) He travels a lot.
単語レベル文パターン(日本語) 126#126127#1272#2だ。
単語レベル文パターン(英語) 126#126 2#2 127#127 .


表: 学習文対と単語レベル文パターンの例6
学習文対(日本語) 彼はギャンブルが好きだ。
学習文対(英語) He is so into gambling.
単語レベル文パターン(日本語) 126#126127#1272#2だ。
単語レベル文パターン(英語) 126#126 2#2 127#127 .

また,表2.23,表2.24,表2.25に3つの学習文対の対訳句と対訳単語確率の例を示す.


表: 対訳句と変数確率の例4
対訳句の変数 日本語句 英語句 1#1
126#126 He 0.4
2#2 好き likes 0.5
127#127 彼女 her 0.6


表: 対訳句と変数確率の例5
対訳句の変数 日本語句 英語句 1#1
126#126 He 0.4
2#2 好き travels 0.6
127#127 旅行 a lot 0.2


表: 対訳句と変数確率の例6
対訳句の変数 日本語句 英語句 1#1
126#126 He 0.4
2#2 好き is so into 0.4
127#127 ギャンブル gambling 0.5

2.23,表2.24,表2.25はいずれも単語レベル文パターンが一致している.また,2#2について日本語句「好き」に対して異なる英語句を用いて表現されている.前節と同様に,この3つの対訳句を 1#1の値が高い順番で順位を決定し,順位が3位以下の対訳句を削除する.それぞれの変数確率とその順位を表2.26に示す.


表: 各学習文対の対訳句2#2の変数確率とその順位2
日本語句 英語句 1#1 1#1の順位
好き likes 0.5 2
好き travels 0.6 1
好き is so into 0.4 3

3位以下の対訳句を削除するので,日本語句「好き」,英語句「is so into」という対訳句を削除する. しかし,対訳句「好き」「travels」は,日本語句「好き」に対して英語句が「travels」と誤っているにも関わらず, 1#1の値が最も高く順位が1となっている.このように誤った対訳句が存在する.その結果,誤った変換テーブルが自動作成され,誤翻訳となる.誤った変換テーブルの作成例を表2.27に示す.


表: 誤った変換テーブルの作成例
学習文対(日本語) 君は料理が得意だ。
学習文対(英語) You are good at cooking.
単語レベル文パターン(日本語) 126#126127#1272#2だ。
単語レベル文パターン(英語) 126#126 2#2 127#127 .
照合する学習文対(日本語) 彼は旅行が好きだ。
照合する学習文対(英語) He travels a lot.
変換テーブル2#2 A:得意 B:are good at
  C:好き D:travels

変換テーブル2#2について,下線部の日本語句「好き」が英語句「travels」と誤っている.本稿では,この問題を解決するために新しい手法を提案する.