next up previous contents
次へ: 文節区切りフレーズ対の問題 上へ: 提案手法において翻訳精度が低下した文の解析 戻る: 提案手法において翻訳精度が低下した文の解析   目次


単語区切りフレーズ対の問題

「単語区切りフレーズ対の問題」は,「提案手法が用いた文節区切りフレーズテー ブルのフレーズ対は適切であるが,単語区切りフレーズテーブルのフレーズ対が 不適切であるため,翻訳精度が低下した文」である.提案手法において翻訳精度 が低下した18文中に,単文の翻訳結果で1文,重文複文の翻訳結果で3文あった. 例を以下に示す.

入力文 僕 も それ と 同じ よう な 覚え が ある 。
従来手法 I remember that I have the same type .
提案手法 I like I remember the same as that .

ここで,従来手法の出力文が用いたフレーズ対と提案手法の出力文が用いたフレー ズ対を表[*]に示す.


表: 出力文が用いたフレーズ対(単語区切りフレーズ対の問題)
従来手法が用いたフレーズ対 提案手法が用いたフレーズ対
僕 も $ \vert\vert\vert$ I have 僕 も $ \vert\vert\vert$ I
それ と $ \vert\vert\vert$ that それ と 同じ $ \vert\vert\vert$ the same as that
同じ よう な $ \vert\vert\vert$ the same type よう な $ \vert\vert\vert$ like
覚え が ある $ \vert\vert\vert$ I remenber 覚え が ある $ \vert\vert\vert$ I remenber
$ \vert\vert\vert$ . $ \vert\vert\vert$ .

提案手法において,適用された文節区切りフレーズテーブルのフレーズ対``僕 も $ \vert\vert\vert$ I''は不適切とはいえない.しかし,単語区切りフレーズテーブルのフ レーズ対``よう な $ \vert\vert\vert$ like''は,本出力文においては,不適切である.本入 力文において,``同じ'',``よう'',``な''は1個のフレーズ対で翻訳されるこ とが好ましい.文節区切りフレーズテーブルには``同じ よう な$ \vert\vert\vert$ the same''といったフレーズ対が存在するが,本出力文では用いられず,異なるフレー ズ対で翻訳され,翻訳精度が低下した.また,係り受けを考えると`同じ'', ``よう'',``な'',``覚え''が1個のフレーズ対で翻訳されることが好ましいが, 本手法では学習データから生成されなかった.

このことから,提案手法では語のまとまりとして文節を用いて学習データを統合 したが,語の意味や係り受けを考慮した統合を行い学習データとして用いることで, 適切なまとまりを持つフレーズ対を学習できると考えている.



平成22年2月17日