next up previous contents
次へ: 古市らの研究における問題点 上へ: 省略補完を統計翻訳へ適用した先行研究 戻る: 古市らの研究   目次

平らの研究

平らは,話し言葉タスクの日英統計翻訳において,日本語文の省略格要素を人手で補完し,翻訳を行った.なお,デコーダのパラメータチューニングは行っていない.実験手順を以下に示す.
手順1
日本語語彙大系[17]の構文辞書から,テストデータの用言を含む構文パターンを抽出する.
手順2
抽出した構文パターンの必須格を確認し,テストデータにおいて必須格が省略されている場合,省略タグと助詞の組を付与(省略補完)する.省略タグは,省略格要素の人称を区別する目的で,4種類を用いる.表3.9に省略タグを示す.


表: 省略タグ
人称 省略タグ
1人称 exo_1
2人称 exo_2
3人称 exo_3
その他 exo_ph

また,省略補完の例を表3.10に示す.


表: 省略補完
テストデータ 連休中に帰れればいいので。
構文辞書 (N1が)(N2から)(N3に)帰る
省略補完文 exo1がexo3にexo3から連休中に帰れればいいので。

手順3
省略補完を行ったテストデータに対して,統計翻訳を行う.

実験の結果,テストデータのみ省略補完を行った場合,人手評価では,50文中15文において翻訳精度の向上を,3文において翻訳精度の低下を報告した.また,自動評価では,BLEU値において0.0016向上を報告した.一方,学習データに主語の補完を行った場合,翻訳精度の低下を報告した.



平成25年2月13日