入力文 | 彼 は 麻薬 所持 の 疑い で 検挙 さ れ た 。 | |||
参照文 |
|
|||
従来手法 | He was arrested on suspicion of 麻薬 所持 . | |||
提案手法 | He was arrested on suspicion of accepting drugs . |
表4.6と比較すると, 評価の出力文は2文まで大きく減少している. したがって, 未知語処理における本手法の有用性が証明された. また, 本手法で正しい出力がされない文章は従来手法の出力で日本語を含まない文章に多いことがわかる. つまり, 未知語が存在しない文章の翻訳の際に本手法は精度が低くなる.
以上より, 事前に未知語出力用変換テーブルを作成するのではなく, 予め従来手法で翻訳を行った後, 翻訳できなかった部分のみを取り出してNMTによって翻訳を行うという手法ならば精度が向上すると考えられる.