次へ: 古市らの研究における問題点
上へ: 省略補完を統計翻訳へ適用した先行研究
戻る: 古市らの研究
目次
平らは,話し言葉タスクの日英統計翻訳において,日本語文の省略格要素を人手で補完し,翻訳を行った.なお,デコーダのパラメータチューニングは行っていない.実験手順を以下に示す.
- 手順1
- 日本語語彙大系[17]の構文辞書から,テストデータの用言を含む構文パターンを抽出する.
- 手順2
- 抽出した構文パターンの必須格を確認し,テストデータにおいて必須格が省略されている場合,省略タグと助詞の組を付与(省略補完)する.省略タグは,省略格要素の人称を区別する目的で,4種類を用いる.表3.9に省略タグを示す.
表:
省略タグ
人称 |
省略タグ |
1人称 |
exo_1 |
2人称 |
exo_2 |
3人称 |
exo_3 |
その他 |
exo_ph |
また,省略補完の例を表3.10に示す.
表:
省略補完
テストデータ |
連休中に帰れればいいので。 |
構文辞書 |
(N1が)(N2から)(N3に)帰る |
省略補完文 |
exo1がexo3にexo3から連休中に帰れればいいので。 |
- 手順3
- 省略補完を行ったテストデータに対して,統計翻訳を行う.
実験の結果,テストデータのみ省略補完を行った場合,人手評価では,50文中15文において翻訳精度の向上を,3文において翻訳精度の低下を報告した.また,自動評価では,BLEU値において0.0016向上を報告した.一方,学習データに主語の補完を行った場合,翻訳精度の低下を報告した.
平成25年2月13日