そこで本研究では,表現の構造から語義を解析する能力が「結合価パターン」にあることに着目して,日本語語彙大系に収録されている全ての結合価パター ンに対して情緒の生起に関する情報を付与した情緒推定用の結合価パターン辞 書の開発を目的とする.
本パターン辞書の開発において重視する点は3つである.
1)情緒生起の原因と語義の関係を定める基準を設ける必要があること,
2)情緒生起の判断には,文脈情報や世界知識を用いて解析しなければならない
部分があり,こうした部分と語義を結びつけておく必要があること,
3)作成した辞書の精度と網羅性を確認する必要があること.
本研究では,こうした作業を3段階に分けて実施する. 最初の段階として,情緒生起の原因が端的な記述で示された徳久らの 情緒生起の特徴に着目し,語義と情緒の対応付けを行う.そのために,登場人物の明確さ等などの付与基準を設け,作業目的とする14,819件の結合価パターンに情緒属性を付与する. 次の段階として,世界知識や文脈情報を 取り込むための「前提条件」を辞書に設けることで,語義の解析に続いて意味理解の 観点を含んだ情緒推定を行う. 最後に,新たに3名の分析者が分担で辞書の検査を行い,校正を行う. そして付与作業の結果,付与基準を満たした結合価パターンは7,759個あり,付 与した情緒属性は11,724個となった.結合価パターン全体の52%が情緒的な属性 を持つことがわかった.さらに,結合価パターンによる推定の精度を計るために 行った推定実験では,〈正答率〉67%の数字を得た.これは人手による〈正答率〉 が70%〜85%であったことから比較的高い数字であるといえる.これによって本 研究で目的であった辞書の開発に成功したといえる.今後の課題は,前提条件で 定義した変数と結合価パターン中の変数番号のレベルの関連づけを行うことであ る.