また,言語モデルでは学習文対の種類によって,統計的に偏ったモデルが構築される問題が報告されている.このため,ある種類の学習文対に別の種類の学習文対を追加した場合,翻訳精度は向上しない.または,翻訳精度が低下する.
別の問題として,統計翻訳では学習文対のどの情報が翻訳に利用されたのかが不明確である.このため,統計翻訳に対して,どのような改善を行うのか解析を行うのは容易ではない.このような問題は現在,活発に研究が行われているニューラル機械翻訳にも同じことが言える.