未知語を含まない文

提案手法の未知語処理前の出力文において,未知語を含まない文は787文あった.これらの文について,提案手法○およびベースライン○の場合の例を示す.
  1. 提案手法○の出力例

    8.1において,入力文の``考察している''に対する出力が提案手法では``is considering''と比較的正しい翻訳になっている.しかしベースラインでは``has revolutionized''となっており,誤った訳語が出力されている.この原因として,ベースラインの低頻度語を含む全語彙を学習する方法では,モデルが学習する語彙数が大きすぎるために,出力単語候補の確率的選定の精度が低下していることが推察される.


    Table 8.1: 未知語を含まない文(提案手法○の出力例)



  2. ベースライン○の出力例

    8.2において,提案手法の出力文では入力文の意味を大きく損失しているのに対し,ベースラインの出力文では比較的正確な訳となっている.この例では入力文の``状勢''が頻度1単語であり,頻度1単語を学習しているベースラインでは正しい訳が出力されたと考えられる.提案手法の出力文に入力文中の原言語単語(未知語)が出力されず,対訳単語辞書を用いた翻訳が行われなかったことも誤りの一因と考えられる.


    Table 8.2: 未知語を含まない文(ベースライン○の出力例)





s142006 2018-03-06