次へ: 手順2 単語に基づく文パターン辞書
上へ: 提案手法の詳細
戻る: 提案手法の詳細
目次
手順1 単語辞書
単語辞書を作成するために,対訳学習文とGIZA++を用いる.まず,GIZA++から英日方向,日英方向の単語対応を調べる.そして,英日方向の単語辞書と日英方向の単語辞書と単語翻訳確率を得る.最後に英日方向の単語翻訳確率と日英方向の単語翻訳確率を掛け合わせる.
本研究では英日方向と日英方向の単語翻訳確率を掛け合わせて得た確率値を単語確率と呼ぶ.また,単語辞書は単語確率から得る.次節の単語に基づく文パターン辞書の作成で用いる単語辞書は,文パターン数を抑制するために閾値を設ける.
以降,閾値により選別した単語辞書を``単語辞書(手順1)'',閾値を用いない単語辞書を``単語辞書(GIZA)''と定義する.また,閾値は5章で説明する.
図4.1に英日方向の単語辞書の作成手順と例を示す.
図4.2に日英方向の単語辞書の作成手順と例を示す.
図4.3に単語辞書(GIZA)の作成手順と例を示す.
0
表に日英単語辞書の例を示す.
表:
日英単語辞書の例
彼 |
He |
0.81 |
彼女 |
her |
0.8 |
平成26年3月13日