次へ: IBMモデル
上へ: 句に基づく統計翻訳システム
戻る: 句に基づく日英統計翻訳の概要
目次
翻訳モデルは日本語単語列から英語単語列へ確率的に翻訳を行うためのモデルである.翻訳モデルには単語に基づく翻訳モデルと句に基づく翻訳モデルがある.初期の統計翻訳では,単語に基づく翻訳モデルを用いていた.しかし,翻訳精度の高さから,現在は句に基づく翻訳モデルが主流となっている.句に基づく翻訳モデルは一般的にフレーズテーブルで管理される.句に基づく翻訳モデルの作成手順を以下に示す.
- 手順1
- 後述するIBMモデルを用いて,単語対応づけを行う.
- 手順2
- ヒューリスティックなルールを用いて句に基づく対応づけを行う.
- 手順3
- 手順2で求めた句に基づく対応づけからフレーズテーブルを作成する.
表2.1にフレーズテーブルの例を示す.
表:
フレーズテーブルの例
日本語句 |
英語句 |
|
|
|
|
あの 人 |
That person |
0.716 |
0.182 |
0.157 |
0.012 |
自由 に |
free |
0.041 |
0.011 |
0.153 |
0.101 |
見 に 行く |
go to see |
0.333 |
0.003 |
0.500 |
0.004 |
ここで,フレーズテーブルは左から順に日本語句,英語句,英日方向の翻訳確率
,英日方向の単語翻訳確率の積
,日英方向の翻訳確率
,日英方向の単語翻訳確率の積
である.
Subsections
平成27年3月13日