next up previous contents
次へ: 実験結果 上へ: 翻訳実験 戻る: 翻訳実験   目次

対訳フレーズデータ

学習データの英語文と日本語文,人手で作成された辞書の英語フレーズと日本語フレーズのそれぞれをマッチングを行った.マッチした場合は,学習データ中のフレーズの単語間のスペースを``-''に置き換えた対訳フレーズデータを作成する. ベースラインで用いる学習データ100,000文対に対し,提案手法(鳥バンク)で作成された対訳フレーズデータの数と提案手法(英辞郎)で作成された対訳フレーズデータの数を表6.1に示す.


表: 対訳フレーズデータの数
  単文 重文複文
提案手法(鳥バンク) 97,649 99,902
提案手法(英辞郎) 83,017 84,782



平成23年3月23日