next up previous contents
次へ: 目次 上へ: paper 戻る: paper   目次

概要

言語の意味理解の1つとして,発話された文から話者や登場人物の情緒 を推定する技術の実現が期待されている.これに対して既に佐伯らの文中の副詞や形容詞 の感情表現性に注目した解析や,目良らによる動詞の深層格関係に注目した解析が提案されている. 文脈解析型は深い情緒推定を行うことができるが推論のコストが高いことが問題 となる. 一方,深層格解析型はコストは比較的高くはないが,文脈との関わりが不明確なために深い推定を行うことができない.またその実現には用言の語義解析が必要であり,更に語義ごとに情緒推定の条件式の割り当てが必要であることも問題となる.そこで,機械翻訳の分野で,日本語の主要な用言の語義を網羅的に類型化した「結合価パターン」が語義解析に有効であることに着目する. これにより,既存の意味解析の知識ベースである「結合価パターン辞書」を用い て語義解析を行うこととし,パターン知識に情緒推定のための情報を付与し,文脈との関 連付けを明記する方法が考えられる.

そこで本研究では,表現の構造から語義を解析する能力が「結合価パターン」にあることに着目して,日本語語彙大系に収録されている全ての結合価パター ンに対して情緒の生起に関する情報を付与した情緒推定用の結合価パターン辞 書の開発を目的とする.

本パターン辞書の開発において重視する点は3つである.
1)情緒生起の原因と語義の関係を定める基準を設ける必要があること,
2)情緒生起の判断には,文脈情報や世界知識を用いて解析しなければならない 部分があり,こうした部分と語義を結びつけておく必要があること,
3)作成した辞書の精度と網羅性を確認する必要があること.

本研究では,こうした作業を3段階に分けて実施する. 最初の段階として,情緒生起の原因が端的な記述で示された徳久らの 情緒生起の特徴に着目し,語義と情緒の対応付けを行う.そのために,登場人物の明確さ等などの付与基準を設け,作業目的とする14,819件の結合価パターンに情緒属性を付与する. 次の段階として,世界知識や文脈情報を 取り込むための「前提条件」を辞書に設けることで,語義の解析に続いて意味理解の 観点を含んだ情緒推定を行う. 最後に,新たに3名の分析者が分担で辞書の検査を行い,校正を行う. そして付与作業の結果,付与基準を満たした結合価パターンは7,759個あり,付 与した情緒属性は11,724個となった.結合価パターン全体の52%が情緒的な属性 を持つことがわかった.さらに,結合価パターンによる推定の精度を計るために 行った推定実験では,〈正答率〉67%の数字を得た.これは人手による〈正答率〉 が70%〜85%であったことから比較的高い数字であるといえる.これによって本 研究で目的であった辞書の開発に成功したといえる.今後の課題は,前提条件で 定義した変数と結合価パターン中の変数番号のレベルの関連づけを行うことであ る.



平成18年3月24日