next up previous contents
次へ: 翻訳実験 上へ: 全てのフレーズテーブルを用いた実験 戻る: 全てのフレーズテーブルを用いた実験   目次

フレーズテーブルのフレーズ対の数

従来手法のフレーズテーブルと[*]章と[*]章で生 成された3つのフレーズテーブルを併用する.フレーズテーブルのフレーズ対の 数を[*]に示す.


表: 英語文をフレーズ単位に統合した場合の各フレーズテーブルのフレーズ対の数(学習データ:283,707文)
  日本語文の単語数 英語文の単語数 フレーズ対の数
日:単語,英:単語(従来手法) 3,377,811 2,828,062 1,742,020
日:文節,英:単語(文節区切り) 1,695,658 2,828,062 1,041,805
日:単語,英:フレーズ 3,377,811 2,215,378 1,147,845
日:文節,英:フレーズ 1,695,658 2,215,378 798,124
4つを併用     4,739,794

4つのフレーズテーブルにおいて,確率は異なるが,日本語フレーズと英語フレー ズの対応が同じフレーズ対は2,220,356件存在する.そのため,4つのフレーズテー ブルを併用した場合のユニークなフレーズ対の数は2,519,438件である.



平成22年2月17日