提案手法における翻訳および未知語処理の過程を図2に示す.
翻訳および未知語処理の過程ではまず,学習の過程で得られたNNモデルを用いて入力文から出力文を生成する.NNモデルは語彙数が制限されているため,翻訳時,入力文に低頻度語や未知語が含まれる場合などに,出力文中にunkが生成される.
unkを含む出力文には,unkの原言語単語への置換処理[2]を行う.
最後に未知語処理として,入力文中の原言語単語(未知語)を含む出力文に対して,未知語を対訳単語辞書から検索し,対訳単語確率最大となる訳語を選択する[3].訳語の選択が成功した場合は,その訳語を元の出力文の未知語部分に置換し,最終的な出力文を生成する.
Figure 2:
提案手法における翻訳および未知語処理
|
s142006
2018-03-06