言語の意味理解の一つとして,言語表現から書き手や話者,登場人物の情緒を推 定する技術に期待が寄せられている.
これに対して,情緒推定へのアプローチとしては,「情緒の明示的な表現に着目し た手法」と「情緒 生起の原因に着目した手法」がある. 前者については,感情を表すことができる副詞・形容詞の解析 [1]や,情緒を明示的に表す用言に注目し た情緒推定[2]がある.一方,後者については 結合価パターン辞 書を構築することで用言の語義から情緒の生起原因を明記した特徴(情緒原因)を解析し,情緒を推定する手法があ る[3]. しかし,この手法において,結合価パターン辞書は用言の語義から情緒の生起原 因を明記した特徴の一部分しか解析できない.用言の語義で解析できなかった特 徴は,語義により保証されない(以後,非保証という)ままであり,他の手法に よって保証する必要がある.
語義で非保証の特徴を保証するための手法としては,文脈解析を用いる方法や,一般常識を用 いる方法がある. 文脈解析を用いる方法として,先行研究[4][5]では前提条件を導入した.前提 条件には,情緒の生起原因を明記した特徴が複数の条件に分けられて記載されており,文脈情報 から前提条件を満足するかどうか調べた上で,情緒の成立/不成立を判断できる ようにした.一方,一般常識を用いる方法 として, Liu[6]は,コーパスにおいて英文で表現された一般常識を6種類の情緒へ評 価値をつけて分類することで,一般常識と情緒の共起関係を示したモデルを構築 した.しかし,格要素が省略された場合に,正しく解析を行えないことが問題で ある.
そこで本研究では,結合価パターン辞書に判断条件を補強することを目的とする. 判断条件とは,語義が非保証の特徴を保証するための条件である. この判断条件を用いると,格要素が省略された場合でも,正しい特徴をもつ結合 価パターンを解析することができると考えられる.判断条件は結合価パターン中 の格要素同士を関係づけることで表現する.そして,Webデータより,判断条件 と情緒との共起関係を調べ,一般常識として判断情報知識ベースに蓄積する.それぞれ の判断条件について情緒が成立する件数が成立しない件数より多ければ,語義が 非保証の特徴を保証できると判断する.逆に,情緒が成立する件数より,成立しない件数が 多い場合は,語義が非保証の特徴を保証できないと判断する.
そのためには,(1)結合価パターン辞書の補強を行う.次に,(2)補強した結合価パターン 辞書の評価を行う.
具体的に,(1)では,まず,(1-1)判断条件を設計することで,語義で非保証の特徴に対 して,格要素同士を関係づけることで表せるようにした.次に,(1-2)先行研究 [4]で,情緒に関する情報(以後,情緒属性という)が付与された 11,723件のセットに対して,人手で判断条件を追加した.
以上の作成に対して(2)では,(2-1)ラン ダムに抽出した500件のセットに対して,判断条件を再付与することで調査した. (2-2)判断条件を付与したセットの一部分を対象に,判断条件によっ て関係づけた格要素同士の関係が成立するか否か,Webデータを活用して統計的 に判定する手法を試みた.
以上の結果として,(1-1)では,特徴フレームを参考にして7種類の判断条件を設計した.(1-2) では,判断条件を付与することができたセットは11,362件であった. また,これより情緒属性が付与されたセットの96.9%をカバーできることが分かった. (2-1)では,一致率は68.6%であった. この一致率には,誤り分析結果より,部分的な付与基準の揺れが影響を 与えていることが分かった.今後,修正を行い,結合価パターン辞書の精度を上げ る必要がある. (2-2)では,Webデータを利用して,判断条件によって関係づけた格要素同士の関係が 成立するか否か調査した結果,統計的に判定することができることを確認した.
以上により,本研究では情緒属性が付与された結合価パターンのセットへ判断条件を網羅的 に付与することができた.また,判断条件によって関係づけた格要素同士の関係 が成立するか否か,統計的に判定することができたので,一般知識(判断情報知 識ベース)を用いた情緒推定ができる可能性を確認できた.
今後の課題は,大 規模な判断情報知識ベースの構築及び,評価実験である.また,誤り分析によっ て見つかった付与基準の揺れに対する修正も行う必要がある.