統計翻訳の問題点

Next: 古瀬らの研究[6] Up: 統計翻訳 Previous: 句に基づく統計翻訳 Contents

統計翻訳では，学習文対から統計的な数値を学習し，言語モデルや翻訳モデルを構築する．この言語モデルや翻訳モデルを利用して翻訳を行う．自然言語文は無数に存在するため，限られた学習文対から完全な言語モデルや翻訳モデルを構築するのは不可能である．このため，統計翻訳は精度が低い．

また，言語モデルでは学習文対の種類によって，統計的に偏ったモデルが構築される問題が報告されている．このため，ある種類の学習文対に別の種類の学習文対を追加した場合，翻訳精度は向上しない．または，翻訳精度が低下する．

別の問題として，統計翻訳では学習文対のどの情報が翻訳に利用されたのかが不明確である．このため，統計翻訳に対して，どのような改善を行うのか解析を行うのは容易ではない．このような問題は現在，活発に研究が行われているニューラル機械翻訳にも同じことが言える．

Hiroto Yasuba 2019-05-08