次へ: パターン翻訳部の実験結果
上へ: 翻訳実験
戻る: 翻訳実験
目次
日本語テスト文10,000文と日本語学習文100,000文のパターン翻訳には,同じ日
英対訳単語辞書と日英文パターン辞書を用いて行う.提案手法で用いる日英対訳
単語辞書と日英文パターン辞書の作成手順を以下に示す.
- 手順1
-
GIZA++を用いて日英対訳学習文100,000文から日英単語辞書と英日単語辞
書を作成する.
- 手順2
-
手順1の日英単語辞書と英日単語辞書の各単語の確率を掛け合わせ,
閾値以上の確率を持つ単語を用いて日英対訳単語辞書を作成する.
- 手順3
-
日英対訳学習文100,000文と手順2の日英対訳単語辞書を用いて日英文パターン辞書を作成する.
日英対訳単語辞書を作成する時の閾値について,今回の実験では0.25,0.02,
0.01の3つの場合で日英対訳単語辞書を作成する.表6.1に各閾値にお
ける日英対訳単語辞書の登録単語数を示す.
表 6.1:
日英対訳単語辞書の登録単語数
閾値
|
登録単語数
|
0.25
|
3,033
|
0.02
|
34,587
|
0.01
|
53,185
|
平成22年2月11日