例1 | |
入力文 | ワイン は ブドウ で 作る 。 |
ベースライン | The wine grapes . |
パターン | Wine is made in grapes . |
提案手法 | Wine is made from grapes . |
日文パターン | X1 は X2 X3 作る 。 |
英文パターン | X1 is made X3 X2 . |
例2 | |
入力文 | 彼 に 不満 を 抱い て いる 。 |
ベースライン | I asked him to his dissatisfaction with . |
パターン1 | He has His in dissatisfied . |
パターン2 | in His is sitting on her dissatisfied . |
提案手法 | He has dissatisfied with him . |
日文パターン1 | X1 X2 X3 を 抱い て いる 。 |
英文パターン1 | He has X1 X2 X3 . |
日文パターン2 | X1 X2 X3 を 抱い X4 いる 。 |
英文パターン2 | X2 X1 X4 sitting on her X3 . |
例3 | |
入力文 | この セーター は 体 に 合わ ない 。 |
ベースライン | This sweater does not agree with . |
パターン1 | The sweater do not match with in body . |
パターン2 | This sweater does not match in The body . |
提案手法 | The sweater do not match with the body . |
日文パターン1 | この X1 X2 X3 X4 合わ X5 。 |
英文パターン1 | X2 X1 do X5 match with X4 X3 . |
日文パターン2 | X1 X2 X3 X4 X5 合わ X6 。 |
英文パターン2 | X1 X2 does X6 match X5 X3 X4 . |
表8.4の例1では,適合した文パターンに十分な文法情報が残されてい ることがわかる.パターン翻訳のみの出力では``in''となっている部分が,提案 手法では``from''となり,精度の高い文が得られている.ベースラインでは動詞 がないので,意味が理解できない文となっている.
例2では,ベースラインの出力では``asked''が存在することで文全体の意味が入 力文と大きく異なる文となっている.パターン翻訳のみの出力では語順に問題が あることがわかる.提案手法ではその語順の問題を修正し,意味が理解できる文 となっている.
例3では,ベースラインの出力の動詞には``agree''が使用されており,英語文と して意味的に問題がある.一方,パターン翻訳のみの出力では,``パターン1'' の出力と``パターン2''の出力の差はほとんどなく,どちらの出力も入力文をあ る程度理解することが出来る.そして提案手法では,文の途中の大文字などの部 分を修正し,精度の高い文となっている.
以上の結果から,文パターンの変数が少し増加し,パターン翻訳の精度が低下し ても,統計翻訳の局所的な修正を行うことで翻訳精度が高い文が得られることが 分かる.
次に,提案手法における出力の失敗例を表8.5を示す.
例1 | |
入力文 | 母 は 悲しみ に 沈ん で い ます 。 |
ベースライン | My mother has been submerged in grief . |
パターン1 | My Sorrow The Mother are in in sank . |
パターン2 | Mother sank in Sorrow city . |
パターン3 | in are Sorrow sank up The the Mother . |
パターン4 | The Mother in sank at in front Sorrow . |
提案手法 | My mother fell in the sadness in the sea . |
日文パターン1 | X1 X2 X3 X4 X5 X6 い ます 。 |
英文パターン1 | My X3 X2 X1 are X6 X4 X5 . |
日文パターン2 | X1 は X2 X3 X4 で い ます 。 |
英文パターン2 | X1 X4 X3 X2 city . |
日文パターン3 | X1 X2 X3 X4 X5 で い ます 。 |
英文パターン3 | X4 are X3 X5 up X2 the X1 . |
日文パターン4 | X1 X2 X3 X4 X5 X6 い ます 。 |
英文パターン4 | X2 X1 X6 X5 at X4 front X3 . |
例2 | |
入力文 | 彼女 は 家庭 の 事情 で 高校 を 中退 した 。 |
ベースライン | She 中退 a high school because of family circumstances . |
パターン | The Her midyear family a of high in his circumstances . |
提案手法 | She midyear of the high in his family circumstances of that time . |
日文パターン | X1 X2 X3 X4 X5 X6 X7 X8 X9 し た 。 |
英文パターン | X2 X1 X9 X3 X8 X4 X7 X6 his X5 . |
例3 | |
入力文 | キャンプ ファ イヤー の 火 が 赤 々 と 燃え て いる 。 |
ベースライン | The fire in the camp fire is burning brightly . |
パターン | and of fire The Fields is burning juddered red refugee juddered . |
提案手法 | The fire is burning red with the Falabella camp fire . |
日文パターン | X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 いる 。 |
英文パターン | X9 X4 X5 X6 X8 X11 X10 X3 X7 X1 X2 . |
表8.3の例1では,ベースラインの出力文からは入力文の意味をおおまか に理解できる.一方,パターン翻訳のみの出力では,不要であると考えられる 単語が存在するため,入力文の意味が理解できない.提案手法では,修正されて おり意味を出来る文となってはいるが,``in the sea''という不要なフレーズが 存在している.
例2では,ベースラインの出力文には未知語が存在しているが,文全体として入 力文の意味が理解できる文となっている.しかしパターン翻訳のみの出力文では 動詞が存在せず,提案手法の出力文でも動詞が存在しないので,精度の低い文と なっている.
例3では,ベースラインの出力では入力文の意味が理解できる文となっている. パターン翻訳時に適合した英文パターンは全て変数化されており,出力文では全 く意味が理解できない文となっている.提案手法では大幅に修正され入力文の意 味を少し理解できる文となっている.しかし,``Falabella''という不要な単語 が存在している.
以上の結果から,実験条件2では,文パターン中の変数が増加し,文パターンが 持つ文法情報が大幅に損なわれていることがわかる.しかし,第 7.1.2章の結果と,第8.1章の結果から,実験条件1と 比較して入力文の適合数は大きく増加している.したがって,文パターン作成時 に使用する日英対訳単語辞書の閾値を考慮することで,適合数を増加し,文法情 報を少しでも多く残すことが出来ると考えられる.