next up previous contents
Next: IBM翻訳モデルの比較 Up: 誤った未知語翻訳の解析 Previous: 頻度1単語の問題   目次

複合語の未知語の問題

未知語の翻訳精度低下につながる別の原因として,複合語の未知語の問題が挙げられる.提案手法では,対訳単語辞書を用いて未知語処理を行っている.対訳単語辞書は1対1対応になっているため,1単語の日本語に対して1単語の英語でしか翻訳することができない.したがって,日本語1単語に対して複数の英単語を必要とするような複合語が未知語の場合には,意味が欠落し翻訳に失敗する.実際に,誤った未知語翻訳となった55単語の内,複合語の未知語は10単語存在した.表7.11に複合語の未知語の翻訳失敗例を示す.表7.11より,翻訳後の単語は全て意味が欠落しており,翻訳に失敗していることが分かる.そして,翻訳前の単語に対する正しい表現は全て句単位であることが分かる.以上のことから,日本語1単語に対して複数の英単語を必要とするような複合語の未知語は,翻訳精度低下につながると考える.


表 7.11: 複合語の未知語の翻訳失敗例
翻訳前 翻訳後 正しい表現
冷夏 summer cold summer
白雲 white white cloud
今秋 autumn this autumn
金婚式 golden golden wedding
中南米 Latin Latin America



s122019 2018-02-15