ベースライン入力文 | 雨になりそうだ。 |
日本語補完入力文 | 私は雨になりそうだ。 |
正解文 | It is likely to rain . |
ベースライン出力文 | It looks like rain . |
日本語補完出力文 | I is likely to rain . |
``雨になりそうだ。"の主語としては,``天気は"のようなものが好ましい.しかし,誤って文頭に``私は"を補完したため,出力文が誤っている.このような主語補完の誤りによる翻訳精度の低下は,適切な主語補完アルゴリズムの考案によって改善される.例えば,動詞や形容詞より,主語が人かどうかを判断し,人であると判断した場合のみ``私は"を補完するというような方法で改善が可能であると考える.
2つ目に,``主語省略文"翻訳を翻訳した際に,すでに出力文にうまく主語が翻訳されている場合,主語を補完することで,誤ったフレーズが出力されてしまうことである.表54に例を示す.
ベースライン入力文 | 泥棒に入られた。 |
日本語補完入力文 | 私は泥棒に入られた。 |
正解文 | I had a burglar break into my home . |
ベースライン出力文 | My house was robbed . |
日本語補完出力文 | My house was robbed of my life . |
表54では,入力文に主語が省略されている場合でも,主語として``My house"が出力されている.この場合に入力文に対し主語補完を行うと,``私は"がうまく翻訳されず,``of my life"のように,誤ったフレーズが出力されてしまう.この翻訳精度の低下は,学習データには``主語省略文"が含まれているので,``主語省略文"が入力された場合でも主語を出力し,適切な翻訳を行う場合があることが原因であると考えられる.このような場合,``主語省略文"に主語補完を行うことで,誤ったフレーズを出力する.
このような原因で翻訳精度の低下が見られる文はわずかである.しかし,統計翻訳を実用する際に主語補完を行う場合,この翻訳精度の低下を無視することはできないと考える.この問題に対しては,学習データに主語補完を行うことにより改善できると考えるが,train補完の実験結果で翻訳精度の低下を確認したため,今後新たな対策の考案が必要であると考える.