次へ: ベースラインと提案手法
上へ: thesis_template2
戻る: 英辞郎
目次
翻訳実験
本研究では日英対訳コーパスとして,単文コーパスと重文複文コーパス[3]を用いた2種類の翻訳実験を行う.
また,対訳句コーパスとして鳥バンク[4]と英辞郎[5]の2種類を用いる.
翻訳実験は日英統計翻訳と英日統計翻訳を行う.
したがって,合計8種類の翻訳実験を行う.
翻訳実験の種類を表に示す.
表:
翻訳実験の種類
日英対訳コーパス |
対訳句コーパス |
統計翻訳 |
単文コーパス |
鳥バンク |
日英 |
単文コーパス |
鳥バンク |
英日 |
単文コーパス |
英辞郎 |
日英 |
単文コーパス |
英辞郎 |
英日 |
重文複文コーパス |
鳥バンク |
日英 |
重文複文コーパス |
鳥バンク |
英日 |
重文複文コーパス |
英辞郎 |
日英 |
重文複文コーパス |
英辞郎 |
英日 |
単文コーパスの実験は単文コーパス182,988文から,重文複文コーパスの実験では重文複文コーパス102,712文から表の内訳で用いる.
また,対訳句対数を表に示す.
表:
使用した実験データ
|
単文 |
重文複文 |
日英対訳コーパス |
100,000 |
91,712 |
テストデータ |
10,000 |
10,000 |
表:
対訳句コーパスごとの対訳句対数
対訳句コーパス名 |
対訳句対数 |
鳥バンク |
698,472 |
英辞郎 |
1,350,299 |
Subsections
平成25年2月12日