next up previous contents
次へ: 謝辞 上へ: ron 戻る: 誤り解析   目次


おわりに

本研究では,統計翻訳において,データの収集が安易なモノリンガルデータを多量に用いて,言語モデルを学習し,翻訳精度を調査した. 使用するモノリンガルデータとして,辞書文,特許翻訳文,Wikipedia文を扱い,日英翻訳,英日翻訳をそれぞれ行った.テスト文には辞書文をそれぞれ用いて,合計6種類の実験を行った.

実験の結果,テスト文と同分野のデータを増やすと,日英翻訳と英日翻訳の翻訳精度が向上した.一方,テスト文と別分野のデータを増やすと,日英翻訳と英日翻訳の翻訳精度はあまり変化しなかった. これにより,分野依存性が高いことを示すことができた.

また,追加するモノリンガルデータの量を変化させて,翻訳精度を調査する実験を行った.結果として,テスト文と同分野の辞書文を追加する実験では,データ量が増加すると,それに比例して翻訳精度が向上することがわかった.

今後は重文複文コーパスや,統計翻訳の別手法での実験を行いたい.



s102025 平成27年3月9日