次へ: 翻訳実験
上へ: 全てのフレーズテーブルを用いた実験
戻る: 全てのフレーズテーブルを用いた実験
目次
従来手法のフレーズテーブルと章と章で生
成された3つのフレーズテーブルを併用する.フレーズテーブルのフレーズ対の
数をに示す.
表:
英語文をフレーズ単位に統合した場合の各フレーズテーブルのフレーズ対の数(学習データ:283,707文)
|
日本語文の単語数 |
英語文の単語数 |
フレーズ対の数 |
日:単語,英:単語(従来手法) |
3,377,811 |
2,828,062 |
1,742,020 |
日:文節,英:単語(文節区切り) |
1,695,658 |
2,828,062 |
1,041,805 |
日:単語,英:フレーズ |
3,377,811 |
2,215,378 |
1,147,845 |
日:文節,英:フレーズ |
1,695,658 |
2,215,378 |
798,124 |
4つを併用 |
|
|
4,739,794 |
4つのフレーズテーブルにおいて,確率は異なるが,日本語フレーズと英語フレー
ズの対応が同じフレーズ対は2,220,356件存在する.そのため,4つのフレーズテー
ブルを併用した場合のユニークなフレーズ対の数は2,519,438件である.
平成22年2月17日