機械翻訳などでは,言語表現のもつ構造の曖昧性が大きな問題となっている.な かでも日本語名詞句は複雑な構造と多様な意味表現をもっている.
日本語名詞句の解析では,コーパスに基づく方法として,単語間の共起情報を用 いて係り先を決定する方法[1]等が提案されている.しかし, 表層的 な情報による解析のため,十分なデータと多くの計算量を必要とする.
最近は名詞の意味属性などによって意味を考慮した解析が行われるようになり, 従来の文法的情報の範囲を越えた解析が可能になってきた.日本語名詞句の解析 では,「名詞+の+名詞+の+名詞」を対象に一般名詞意味属性体系[]を用いた係り受け解析[3]がある.しかし,形容詞を対象にした研 究はあまり行われていない.
本研究では「形容詞+名詞+助詞+名詞」を対象に意味属性を用いた係り受け解 析を行い,その有効性を調査する.まず,助詞によって「形容詞+の型名詞句」と 「形容詞+並列型名詞句」とに分ける.「形容詞+の型名詞句」の係り受け解析 では,「形容詞+名詞」の頻度統計をとり,その値を2単語間の結合力とする.そし て,解析対象となる名詞句を「形容詞+名詞A」,「形容詞+名詞B」とし,2つの結 合力より強い方を係り先とする[4].このとき,字面での係り受け解析と 意味属性による係り受け解析を段階的に行うことで精度の向上を目指す.次に, 「形容詞+並列型名詞句」では,形容詞がより抽象的な名詞に係るという仮定の もとに,意味属性の深さから係り先を決定する手法を提案する.このとき,係り受 け解析に必要な意味属性だけを選択し,木構造を再構築することで,精度の向上と 意味属性の圧縮を行う.