next up previous contents
次へ: 主語補完における先行研究 上へ: 関連研究 戻る: 関連研究   目次

統計翻訳の問題点

猪澤らは,文節区切りとした学習データからフレーズテーブルを作成し,翻訳精度を向上させることに成功した[1].しかし,文節区切りとした学習データを用いて作成したフレーズテーブルを用いた翻訳では,主語が省略されている文においてうまく主語を生成することができず,翻訳精度が低下する原因であると述べている.表11に主語が省略されていることが原因で翻訳精度が低下した例を示す.なお,表11の従来手法では,単語区切りの学習データを用いてフレーズテーブルを作成している.また,表11の先行研究では,文節区切りの学習データを用いてフレーズテーブルを作成している.

表: 翻訳精度が低下した例
入力文 どこかの図書館で数か月懸命に勉強することが必要だ。
従来手法の出力文 I need some months in the library to study hard.
先行研究の出力文 Some few months in the library to study hard necessary.

ここで,従来手法のフレーズ対と,先行研究のフレーズ対を表12に示す.

表: 出力文が用いたフレーズ対(単語区切りフレーズ対の問題)
従来手法のフレーズ対 先行研究のフレーズ対
どこ $ \vert\vert\vert$ I どこかの $ \vert\vert\vert$ Some
かの $ \vert\vert\vert$ some 図書館で $ \vert\vert\vert$ in the library
図書館で $ \vert\vert\vert$ in the library 数ヶ月 $ \vert\vert\vert$ few months
数ヶ月 $ \vert\vert\vert$ months 懸命に勉強する $ \vert\vert\vert$ to study hard
懸命に勉強する $ \vert\vert\vert$ to study ことが必要だ。$ \vert\vert\vert$ necessary .
ことが必要だ $ \vert\vert\vert$ need  
$ \vert\vert\vert$ .  

従来の学習データを用いたフレーズ対において,フレーズ対"どこ $ \vert\vert\vert$ I"は不適切である.しかし,入力文には主語がなく,"どこ $ \vert\vert\vert$ I"を用いて主語を作ることで,出力文の翻訳精度が向上している. 一方で,文節区切りの学習データを用いたフレーズ対では,"どこかの $ \vert\vert\vert$ Some"を用いている.このフレーズ対は適切ではあるが,他のフレーズ対でも主語が生成されず,翻訳精度が低下する原因となっている.
このような主語が省略されている文に対し主語補完を行うことで,主語が生成され,翻訳精度が向上するのではないかと考えられる.


next up previous contents
次へ: 主語補完における先行研究 上へ: 関連研究 戻る: 関連研究   目次
平成23年4月12日