next up previous contents
次へ: 実験結果 上へ: データ量を変化させた実験 戻る: 目的   目次

実験内容

実験環境は第4章と同じである.今回新たな実験データとして,追加するコーパスの1/2,1/4,1/8のデータを使用し,辞書文とWikipedia文で日英翻訳と英日翻訳を行う. 追加実験で使用するモノリンガルコーパスの内訳を表6.1と表6.2に示す.


表: 追加実験の日英翻訳で使用するモノリンガルコーパス
コーパスの内容 辞書文 特許翻訳文 Wikipedia文
追加コーパス1/8 98,555文 425,903文 1,822,433文
追加コーパス1/4 197,110文 851,806文 3,644,867文
追加コーパス1/2 394,221文 1,703,612文 7,289,734文
追加コーパスFULL 788,443文 3,407,225文 14,579,468文


表: 追加実験の英日翻訳で使用するモノリンガルコーパス
コーパスの内容 辞書文 特許翻訳文 Wikipedia文
追加コーパス1/8 100,790文 425,903文 1,575,938文
追加コーパス1/4 201,581文 851,807文 3,151,877文
追加コーパス1/2 403,162文 1,703,615文 6,303,754文
追加コーパスFULL 806,324文 3,407,231文 12,607,508文



s102025 平成27年3月9日