next up previous contents
次へ: 対訳補完についての考察 上へ: 日本語補完についての考察 戻る: 日本語補完による翻訳精度の向上   目次

日本語補完による翻訳精度の低下

日本語補完を用いることで翻訳精度が低下した原因は,2つ挙げられる.まず1つ目は,主語補完の誤りによる翻訳精度の低下である.表53に例を示す.

表: 主語補完の誤りによる翻訳精度の低下
ベースライン入力文 雨になりそうだ。
日本語補完入力文 私は雨になりそうだ。
正解文 It is likely to rain .
ベースライン出力文 It looks like rain .
日本語補完出力文 I is likely to rain .

``雨になりそうだ。"の主語としては,``天気は"のようなものが好ましい.しかし,誤って文頭に``私は"を補完したため,出力文が誤っている.このような主語補完の誤りによる翻訳精度の低下は,適切な主語補完アルゴリズムの考案によって改善される.例えば,動詞や形容詞より,主語が人かどうかを判断し,人であると判断した場合のみ``私は"を補完するというような方法で改善が可能であると考える.
2つ目に,``主語省略文"翻訳を翻訳した際に,すでに出力文にうまく主語が翻訳されている場合,主語を補完することで,誤ったフレーズが出力されてしまうことである.表54に例を示す.


表: 主語補完の誤りによる翻訳精度の低下
ベースライン入力文 泥棒に入られた。
日本語補完入力文 私は泥棒に入られた。
正解文 I had a burglar break into my home .
ベースライン出力文 My house was robbed .
日本語補完出力文 My house was robbed of my life .

54では,入力文に主語が省略されている場合でも,主語として``My house"が出力されている.この場合に入力文に対し主語補完を行うと,``私は"がうまく翻訳されず,``of my life"のように,誤ったフレーズが出力されてしまう.この翻訳精度の低下は,学習データには``主語省略文"が含まれているので,``主語省略文"が入力された場合でも主語を出力し,適切な翻訳を行う場合があることが原因であると考えられる.このような場合,``主語省略文"に主語補完を行うことで,誤ったフレーズを出力する.
このような原因で翻訳精度の低下が見られる文はわずかである.しかし,統計翻訳を実用する際に主語補完を行う場合,この翻訳精度の低下を無視することはできないと考える.この問題に対しては,学習データに主語補完を行うことにより改善できると考えるが,train補完の実験結果で翻訳精度の低下を確認したため,今後新たな対策の考案が必要であると考える.



平成23年4月12日