next up previous contents
次へ: ベースラインと提案手法 上へ: thesis_template2 戻る: 英辞郎   目次


翻訳実験

本研究では日英対訳コーパスとして,単文コーパスと重文複文コーパス[3]を用いた2種類の翻訳実験を行う. また,対訳句コーパスとして鳥バンク[4]と英辞郎[5]の2種類を用いる. 翻訳実験は日英統計翻訳と英日統計翻訳を行う. したがって,合計8種類の翻訳実験を行う.

翻訳実験の種類を表[*]に示す.


表: 翻訳実験の種類
日英対訳コーパス 対訳句コーパス 統計翻訳
単文コーパス 鳥バンク 日英
単文コーパス 鳥バンク 英日
単文コーパス 英辞郎 日英
単文コーパス 英辞郎 英日
重文複文コーパス 鳥バンク 日英
重文複文コーパス 鳥バンク 英日
重文複文コーパス 英辞郎 日英
重文複文コーパス 英辞郎 英日

単文コーパスの実験は単文コーパス182,988文から,重文複文コーパスの実験では重文複文コーパス102,712文から表[*]の内訳で用いる. また,対訳句対数を表[*]に示す.


表: 使用した実験データ
  単文 重文複文
日英対訳コーパス 100,000 91,712
テストデータ 10,000 10,000


表: 対訳句コーパスごとの対訳句対数
対訳句コーパス名 対訳句対数
鳥バンク 698,472
英辞郎 1,350,299



Subsections

平成25年2月12日