次へ: IBM翻訳モデル
上へ: 日英統計翻訳システム
戻る: 概要
目次
翻訳モデルは,日本語から英語の単語列へ,確率的に翻訳を行うためのモデルである.
統計翻訳において,句に基づく翻訳モデルとして,一般的に,フレーズテーブルが用いられている.
フレーズテーブルは以下の手順によって作成される.
- 手順1
- 後述するIBMモデルを用いて,単語の対応を得る
- 手順2
- ヒューリスティックスなルールを用いて句に基づく対応を得る
- 手順3
- 手順2で求めた句対応から,フレーズテーブルを作成する
詳しい作成手順については,後述する.また,表2.1にフレーズテーブルの例を示す.
表:
フレーズテーブルの例
日フレーズ |
英フレーズ |
|
|
|
|
季節 |
the season |
0.3 |
3.6 |
0.1 |
1.8 |
新緑 の 季節 |
the season of green leaves |
0.3 |
3.6 |
0.1 |
2.6 |
雨 の 後 |
after the rain |
0.3 |
1.2 |
0.1 |
1.8 |
左から順に,日本語フレーズ,英語フレーズ,日英方向の翻訳確率
,日英方向の単語の翻訳確率の積,英日方向の翻訳確率
,英日方向の単語の翻訳確率の積である.
Subsections
平成25年2月12日