次へ: フレーズテーブル
上へ: 日英統計翻訳システム
戻る: 統計翻訳の概要
目次
翻訳モデルには,大きくわけて単語ベースの翻訳モデルと句ベースの翻訳モデル[3]がある.初期の統計翻訳は,単語ベースの翻訳モデルを用いていた.しかし,単語ベースの翻訳モデルと比較し,句ベースの翻訳モデルは翻訳精度が高いため,現在は句ベースの翻訳モデルが主流となっている.句ベースの翻訳モデルは,日本語の単語列から英語の単語列へ確率的に翻訳を行うためのモデルであり,対訳コーパスより学習される.以下に,句ベースの翻訳モデルの作成手順を示す.
- 手順1
- GIZA++[2]を用いて,IBMモデルを推定する.IBMモデルについては,詳細を
2.2.2節で説明する.
- 手順2
- IBMモデルから,ヒューリスティックスなルールに基づき,句ベースの翻訳モデ
ルを作成する.作成方法については,2.2.3節で説明する.
この句ベースの翻訳モデルについて,詳細を以下に示す.
Subsections
平成23年4月12日