next up previous contents
Next: 確率値による出力文の選択の誤り Up: 誤り解析 Previous: 変換テーブルの誤り   Contents


利用する対訳文の誤り


Table 6.16: TDSMTの誤り例(対訳文の選択の誤り)
141#141


7の翻訳例では,たくさんの誤りの原因が考えられる.一つは翻訳に利用した対訳文が不適切である.入力文と対訳文の日本語側は構文が近いが,対訳文の英語側と同じ構文で入力文の意味を表すことは困難である.入力文と対訳文で「出た」が共通しているが,対訳文の「appear」を利用して入力文を表現するには構文を変える必要がある.主語の部分に「勉強 に 張り」という表現を入れる必要がある.このため,どの対訳文を利用して翻訳を行うかの選択方法を考案する必要がある.

翻訳確率(言語モデル+変換テーブルの適用確率)の順位で4位までを解析しても,表7に示す対訳文以外の対訳文を利用する出力候補文は存在しなかった.

なお,変換テーブルの問題も同時に出現している.「昨夜」は「Last night」が正しいが,「night」のみと対応した変換テーブルが利用している.これは現在,「82#82が83#83ならば84#84は85#85」の「82#82が83#83」の部分は単語対応に限っている.このため,変換テーブル1のような変換テーブルが作成されてしまう.「82#82の83#83」の部分も句にした変換テーブルを利用することで翻訳精度が向上する可能性が考えられる.



Hiroto Yasuba 2019-05-08