next up previous contents
次へ: ``主語省略文" 上へ: 関連研究 戻る: 統計翻訳の問題点   目次

主語補完における先行研究

中岩ら[5][6][7][8]は,ゼロ代名詞(日本語において省略されている格要素)の解析を行い,ゼロ代名詞照応解析の方法を提案した.まずゼロ代名詞の解析について,日英機械翻訳システム評価用例文3,718文を解析した結果,照応解析を要するゼロ代名詞が484文,510箇所存在することを示した.そして,このゼロ代名詞510件のうち,そこに補完すべき指示対象が文内に存在する場合が139件,文外に存在する場合が371件存在すると報告した.また,ゼロ代名詞の照応解析方法として,文内照応,文間照応,文章外照応の3タイプを提案した.文内照応は,ゼロ代名詞と,補完すべき指示対象が同じ文内に存在する場合,同じ文内の指示対象を補完する方法である.例を表13に示す.


表: 文内照応の例
ゼロ代名詞を含む文 彼は方程式を解いて答えを出した。
文内照応解析による補完結果 彼は方程式を解いて(彼が)答えを出した。

この文内照応は,助詞の種類や,接続語・用言意味属性・様相表現による制約を用い,照応解析を行う.この文内照応解析では,再現率98%,適合率100%の精度で正しい指示対象を決定できたことが報告された.文間照応解析は,新聞記事文のような複数文からなる文章においては,補完すべき指示対象が,ゼロ代名詞が現れる文と異なる文中に存在する場合が多いことを利用し,照応解析を行う方法である.この文間照応解析では,ゼロ代名詞の84%に対して照応解析が成功したことを報告した.文章外照応は,文章中に補完すべき指示対象が現れない場合の照応解析方法である.この文章外照応では,格への意味的制約・用言意味属性・様相表現・接続語などを考慮したルールを構築し,ゼロ代名詞の指示対象を推定する方法である.この文章外照応解析の結果,ルールを複雑にすれば,ほとんどの文において,省略各要素を復元が可能であることを報告した.
これらの方法は,機械翻訳に対して用いることが可能であるが,統計的機械翻訳における主語補完の効果は報告されていない.



平成23年4月12日