対訳文パターンの汎化

追加実験において,追加実験 2回目では,追加実験 1回目に比べ評価21#21が増加した. これは,対訳文パターンの過度な汎化が原因である. 表11.3に例を示す.

語の省略がある対訳文から,長文化した対訳句を用いて,対訳文パターンを作成する場合,日本語文の全てを変数化した対訳文パターンが作成可能になる. このような,対訳文パターンは,語の省略がない対訳文パターンに比べ,広範な対訳文に合致し,誤った対訳句を抽出する.

表: 過度に汎化した対訳文パターンを用いた対訳句の抽出例
対訳句(22#22) 彼は借金を清算した cleared up his debt
対訳文27#27 彼は借金を清算した。 He cleared up his debt.
対訳文パターン 22#22 He 22#22.
対訳句 夜遅く帰宅した got home late at night
対訳文5#5 夜遅く帰宅した。 He got home late at night.