次へ: IBM翻訳モデル
上へ: 句に基づく統計翻訳
戻る: 句に基づく統計翻訳の概要
目次
翻訳モデルは,日本語単語列から英語単語列へ確率的に翻訳を行うためのモデルである.翻訳モデルには,単語に基づく翻訳モデルと句に基づく翻訳モデルが存在する.初期の統計翻訳では,単語に基づく翻訳モデルを用いていた.しかし,翻訳精度の高さから現在は句に基づく翻訳モデルが主流となっている.句に基づく翻訳モデルは,一般的にフレーズテーブルで管理される.句に基づく翻訳モデルの作成手順を以下に示す.
- 手順1
- 後述するIBMモデルを用いて,単語対応づけをする.
- 手順2
- ヒューリスティックなルールを用いて,句に基づく対応づけをする.
- 手順3
- 手順2で求めた句に基づく対応づけから,フレーズテーブルを作成する.
表2.1にフレーズテーブルの例を示す.
表:
フレーズテーブルの例
日本語句 |
英語句 |
|
|
|
|
あの 人 |
That person |
0.716 |
0.182 |
0.157 |
0.012 |
自由 に |
free |
0.014 |
0.011 |
0.153 |
0.101 |
見 に 行く |
go to see |
0.333 |
0.003 |
0.500 |
0.004 |
ここで,フレーズテーブルは左から順に日本語句,英語句,英日方向の翻訳確率,英日方向の単語翻訳確率の積,日英方向の翻訳確率,日英方向の単語翻訳確率の積である.
s122025
平成28年3月21日