next up previous contents
次へ: パターン翻訳の出力における解析 上へ: 考察 戻る: 考察   目次


日英文パターン辞書における問題点

6.3の結果から実験条件1と比べて実験条件2では日本語テスト文の適 合数が多い.しかし表7.2の結果,実験条件1では提案手法が有効である が,表7.4の結果から,実験条件2では提案手法が翻訳精度の低下を引き 起こしている.この原因として,日英文パターン辞書を作成するときに用いた日 英対訳単語辞書の閾値が影響していると考えられる.実験条件1の日英文パター ン辞書の作成には,閾値が0.25以上の登録単語数が少ない日英対訳単語辞書を使 用している.したがって,日英文パターン中の変数が少なく,文法情報が多く残 され,翻訳精度の高い文が出力されたと考えられる.しかし実験条件2の日英文 パターン辞書では閾値が0.01以上の登録単語数が多い単語を使用している.した がって,日本語テスト文の適合数は増加するが日英文パターン中の変数が多く, 複雑になり文法情報が損なわれ,翻訳精度の低い文が出力されたと考えられる. 表8.1に作成した日英文パターンの例を示す.


表 8.1: 作成した日英文パターン辞書の例
例1
私 は X1 を 見 に 行く 。
X1 X2 X3 を 見 X4 X5 。
例2
電車 が X1 を 抜ける 。
X1 X2 X3 X4 抜ける 。
例3
X1 に X2 を X3 。
X1 X2 X3 X4 X5 。

例1の実験条件1の英語文パターンでは``I''が主語であり``go to see''が複合動詞で あることが分かる.しかし実験条件2では``see''が動詞であると考えられ る.したがって,実験条件1では翻訳精度の高い翻訳文が出力されるが実験条件2 では翻訳精度の低い文が出力されると考えられる.

例2の実験条件1の文パターンでは``電車が''となっており主語が電車であると分 かり,目的語として1単語があることが分かる.しかし実験条件2の文パターンで は,動詞の``抜ける''と``go through''が対応していることが分かるが,それ以 外の部分では全く制限がないため,適合する文数は増えるが本来適合すると考え られる入力文以外の文が適合する可能性があり,翻訳精度が低下する原因となる 可能性があると考えられる.

例3では,例2と同様に,適合文に関する問題があるが,実験条件2の文パターン中 の全てが変数であるため,例2よりも適合文数が大幅に増加し,最適な翻訳が得 られなくなる可能性がより高いと考えられる.

この問題に対し,今後日英文パターンが文法情報を十分に保持し,なおかつ日本 語テスト文の適合数を増やすための方法を考える必要がある.


next up previous contents
次へ: パターン翻訳の出力における解析 上へ: 考察 戻る: 考察   目次
平成22年2月11日