実験設定

今回実験において対訳句として利用する外部辞書データには英辞郎[21]を用いる. 表9.1に英辞郎の内訳を, 表9.2に英辞郎の例を示す.

なお,実験に利用する対訳文,テストデータ,ディベロップメントデータには5章と同じ重文複文対訳コーパスを用いる.


表: 英辞郎の内訳
  日本語 英語
句数 550,000句
単語数 1,641,461語 1,405,828語
異なり単語数 110,292語 140,143語
平均句長 2.98語 2.56語



表: 英辞郎の例
日本語句 英語句
シャンデリア chandelier
ドミニク Dominique
継承 する inherit
激烈 な 論争 bitter controversy
私的 諮問 機関 private advisory body