next up previous contents
次へ: 目次 上へ: M11T2017A 戻る: M11T2017A   目次

概要

言語表現から書き手や登場人物の情緒を推定し, 情報を抽出する技術に期待が寄せられている. たとえば,ブログや掲示板などに蓄積されたテキストデータから情緒を推定することで, 商品や社会事情に対する大衆の気持ちを知るといったことが挙げられる. そのためには,文章の用言や格要素などから情緒を明示する表現や, 情緒の生じる原因を表す表現などを検出し, 解析する必要がある.

田中らと吾郷らは,日本語語彙大系の結合価パターンに, 「情緒属性」として,「判断条件,情緒原因,情緒名,情緒主,および,情緒対象」を追加し, 情緒推定用結合価パターン辞書を作成することで, パターンベースの情緒推定の手法を示した. 情緒推定の方法は,以下の3つである. (1)本辞書の全てのパターンと入力文を照合する. (2)意味属性制約を充足する場合,マッチしたパターンに付与されている「判断条件」$C$, および「情緒属性(情緒原因・情緒名・情緒主・情緒対象)」$E$を得る. これで, $C \rightarrow E$という命題を得たことになる. なお,$C$$E$は元々は命題関数であり, そこに用いられる変数$N1,N2$などには入力文の該当部分が代入されている. (3)判断条件$C$の真偽を判定する. 真の場合は,情緒生起の原因が成立するといえるので,情緒名などの$E$を出力する. 偽の場合は,《なし》を出力する(情緒の出力を抑制する).

ここで,判断条件が成立すると仮定することで,用言の語義に基づく情緒推定が可能であり, 格要素にあまり依存することなく情緒推定が可能である. しかし,判断条件を常に成立すると仮定すると, 過剰に情緒が推定される問題が発生した. そこで,滝川らは,辞書を改良して, 判断条件においての二者の関係の方向性である「接近」と「乖離」の関係を扱えるようにした. 問題点は,対称な情緒属性をもたないため,十分には状況の対称性が考慮されていないことである. 対称な情緒属性をもたないことは, 「接近」と「乖離」のどちらも必要な用言(結合価パターン)が存在するが, そのうち,一方の判断条件しか付与されていないこと, もう一方の判断条件に基づく情緒名が付与されていないことを指す.

本研究では,以下の3つを行う. (1)情緒原因ごとに対称な情報属性の必要性の調査を行う. (2)(1)の結果,必要性の高い情緒原因を持つ用言(結合価パターン)に対し,対称な情緒属性の追加を行う. (3)本情緒推定手法の実装を行い, 判断条件が理想的に運用できる状況での情緒推定の性能を,実験により評価する.

以上の結果,(1)では,83種類の情緒原因のうち39%は必要性の高い分類であるが, 61%は低い分類であった. (2)では,本辞書全体を見ると,情緒属性の総数11,712セットに対して, 対称な情緒属性2,142セット,18%(=2,142/11,712)が追加された. 日本語の用言約6,118語のうち,941語(15%)に,情緒推定用の情報を追加した. これらの結果から,全ての用言(結合価パターン)に対して一律に対称な情緒属性を追加するべきではなく, 用言(結合価パターン)ごとに動詞の種類などを考慮して対称な情緒属性を追加するべきであることを確認した. (3)では,理想的な情報の下では,9分類系において, 対称な情緒属性を追加した上での判断条件使用時の情緒推定の一致率は53%となり, 以前の方式の一致率50%よりも3%向上した. また,推定された情緒の95%は正解データの作成者から同意が得られた. この結果から,辞書の拡張の妥当性が確認できた.

以上より,本研究では付与が不十分となっていた対称な情緒属性を追加した. 対称な情緒属性を追加した上での判断条件使用時の情緒推定が, 推定精度向上につながることを確認した.

今後の課題は,情緒名と判断条件を主とする本辞書の見直し・変更・追加, 新たな判断条件の設計, 修飾語句など,情緒推定に使用する情報を1段階増やすことである.



平成25年2月12日