next up previous contents
次へ: パターン翻訳部の実験結果 上へ: 翻訳実験 戻る: 翻訳実験   目次

提案手法におけるパターン翻訳部の実験

日本語テスト文10,000文と日本語学習文100,000文のパターン翻訳には,同じ日 英対訳単語辞書と日英文パターン辞書を用いて行う.提案手法で用いる日英対訳 単語辞書と日英文パターン辞書の作成手順を以下に示す.

手順1

GIZA++を用いて日英対訳学習文100,000文から日英単語辞書と英日単語辞 書を作成する.
手順2

手順1の日英単語辞書と英日単語辞書の各単語の確率を掛け合わせ, 閾値以上の確率を持つ単語を用いて日英対訳単語辞書を作成する.
手順3

日英対訳学習文100,000文と手順2の日英対訳単語辞書を用いて日英文パターン辞書を作成する.

日英対訳単語辞書を作成する時の閾値について,今回の実験では0.25,0.02, 0.01の3つの場合で日英対訳単語辞書を作成する.表6.1に各閾値にお ける日英対訳単語辞書の登録単語数を示す.


表 6.1: 日英対訳単語辞書の登録単語数
閾値
登録単語数
0.25
3,033
0.02
34,587
0.01
53,185



平成22年2月11日