次へ: 句に基づく統計翻訳における未知語処理の1手法
上へ: パターン翻訳を用いた学習データ増加手法の検討
戻る: 考察
目次
本研究では,単言語データに対してパターン翻訳を行い,既存の対訳学習データに付与することで,
対訳学習データを増加させる手法を提案した.実験の結果,自動評価では,ベースラインと比較して単文データセットを用いたチューニングなしの実験,および重文複文データセットを用いたチューニングありの実験において,提案手法の評価値が向上した.また,人手評価においては単文データセットを用いたチューニングなしの実験で提案手法の有効性が確認できた.しかし,その他の実験では提案手法の有効性は認められなかった.原因として,パターン翻訳の学習が既存の対訳データを用いて行われていることが挙げられる.今後は,使用するデータによる翻訳結果の差異の,より詳細な調査が必要である.また,提案手法において,英日方向のパターン翻訳を用いる実験が考えられる.
平成25年2月12日