next up previous contents
次へ: 省略補完を統計翻訳へ適用した先行研究 上へ: 関連研究 戻る: 省略要素の補完における先行研究   目次


主語の省略により翻訳精度の低下を報告した先行研究

猪澤らは,文節区切りとした学習データからフレーズテーブルを作成し,翻訳精度の向上を報告した[1].文節区切り猪澤らの実験手順を以下に示す.
手順1
学習データの日本語文を文節に区切り,文節区切りの学習データを作成する.文節区切りの日本語文の例を表3.2に示す.

表: 文節区切りの日本語文
例1 彼-の お母さん-が ああ 若い-と-は 思わ-なかっ-た 。
例2 ここ-で きみ-に 会お-う-と-は 夢にも 思わ-なかっ-た 。
例3 彼女-は 怠け者-で 自分-の 部屋-の 掃除-も し-ない。

手順2
文節区切りの学習データから,文節区切りのフレーズテーブルを作成する.文節区切りのフレーズテーブルの例を表3.3に示す.

表: 文節区切りのフレーズテーブル
日本語フレーズ 英語フレーズ 日英方向の翻訳確率
道路 の of the road 0.002
読ん だ have read 0.030
贅沢 に 暮らし て いる lives in luxury 0.0097

手順3
単語区切りのフレーズテーブルと文節区切りのフレーズテーブルの両方を用いて,日英統計翻訳を行う.

しかし猪澤らは,主語を省略している文の翻訳において,うまく主語を生成することができず,翻訳品質が低いことを報告した. 表3.4に主語を省略していることが原因で翻訳精度が低下した例を示す.なお,表3.4のMosesのみの手法では,単語区切りの学習データを用いてフレーズテーブルを作成している.また,表3.4の猪澤らの手法では,文節区切りの学習データを用いてフレーズテーブルを作成している.


表: 翻訳精度が低下した例
入力文 どこかの図書館で数か月懸命に勉強することが必要だ。
Mosesのみの手法 I need some months in the library to study hard.
猪澤らの手法 Some few months in the library to study hard necessary.

ここで,Mosesのみの手法におけるフレーズ対を表3.5に,猪澤らの手法におけるフレーズ対を表3.6に示す.


表: Mosesのみの手法におけるフレーズ対
日本語フレーズ 英語フレーズ
どこ I
かの some
図書館で in the library
数ヶ月 months
懸命に勉強する to study
ことが必要だ need
.


表: 猪澤らの手法におけるフレーズ対
日本語フレーズ 英語フレーズ
どこかの Some
図書館で in the library
数ヶ月 few months
懸命に勉強する to study hard
ことが必要だ necessary

Mosesのみの手法のフレーズ対において,フレーズ対``どこ $ \vert\vert\vert$ I"は不適切である.しかし,入力文には主語がなく,``どこ $ \vert\vert\vert$ I"を用いて主語を出力し,出力文の翻訳精度が高い. 一方で,猪澤らの手法のフレーズ対では,``どこかの $ \vert\vert\vert$ Some"を用いている.このフレーズ対は適切ではあるが,他のフレーズ対でも主語が生成されず,翻訳精度が低い原因となっている.よって,日英統計翻訳において,日本語文の主語の省略は問題である.


next up previous contents
次へ: 省略補完を統計翻訳へ適用した先行研究 上へ: 関連研究 戻る: 省略要素の補完における先行研究   目次
平成25年2月13日