next up previous contents
Next: 提案手法 Up: Pattern Based SMT Previous: c)出力文の選択   目次

Pattern Based SMTの問題点

Pattern Based SMTの出力文には,人手評価の低い出力文がある.誤り解析を行っ た結果,不適切な対訳文パターンの選択が一つの原因であった. 人手評価の低い入力文に対して,適切な対訳文パターンを使用した結果,人手 評価の高い出力文が得られた. 不適切な対訳文パター ンを使用した翻訳の例を表3.1に,適切な対訳文パターンを使 用した翻訳の例を表3.2に示す.


表 3.1: 不適切な文パターンを使用した翻訳の例
入力文 指輪 は どこ に も 見当たら なかっ た 。
参照文 The ring was nowhere to be found .
日本語文パターン $ X$ 00 は $ X$ 01 に $ X$ 02 なかっ た 。
英語文パターン It took $ X$ 00 forever to $ X$ 02 $ X$ 01 .
日本語文パターンの原文 彼 は なかなか 仕事 に 取りかから なかっ た 。
英語文パターンの原文 It took him forever to get down to work .
出力文 It took the ring forever to be found anywhere .


表 3.2: 適切な文パターンを使用した翻訳の例
入力文 指輪 は どこ に も 見当たら なかっ た 。
参照文 The ring was nowhere to be found .
日本語文パターン $ X$ 00 は どこ に も 見当たら なかっ た 。
英語文パターン $ X$ 00 was nowhere to be found .
日本語文パターンの原文 その 本 は どこ に も 見当たら なかっ た 。
英語文パターンの原文 The book was nowhere to be found .
出力文 This ring was nowhere to be found .

3.1の例では,日本語文パターンの原文は入力文とは類似しておらず, 生成した出力文に対する人手評価は低い.
 表3.2の例では,表3.1と異なり,日本語文パターンの原文は入力文 と類似している. よって表3.2は,生成した出力文に対する人手評価は表 3.1の例と比較して高い.


next up previous contents
Next: 提案手法 Up: Pattern Based SMT Previous: c)出力文の選択   目次
2015-03-21