次へ: ルールベース翻訳の併用
上へ: 考察
戻る: モノリンガルコーパスの量
目次
提案手法において,学習データに英辞郎を用いた場合と,用いない場合における出力文中の未知語数を表22に示す.また,それぞれの場合における自動評価の結果を表23に示す.なお,対訳コーパスに付与した抽出文対は
それぞれ約50,000文対である.
表:
出力文中の未知語数
|
未知語数
|
提案手法 |
1520
|
英辞郎なし |
5587
|
表:
自動評価結果
|
BLEU
|
NIST
|
METEOR
|
提案手法 |
0.1241
|
4.720
|
0.4999
|
英辞郎なし |
0.1125
|
4.332
|
0.4730
|
結果より,学習データに英辞郎を加えることで,未知語が減少し,翻訳精度が向上している.
したがって,本研究における英辞郎の有効性が確認できる.
平成23年3月3日