next up previous contents
次へ: 目次 上へ: syuron_honron_M12T2020H 戻る: syuron_honron_M12T2020H   目次

概要

言語の意味理解の一つとして,言語表現から登場人物や話者の情緒を推定する技術に期待が寄せられている.なぜなら,この技術はテキストマイニングとして応用できる可能性があるからである.例えば,ブログなどに蓄積されたテキストデータを情緒推定することにより,観光地の情報や,旅行者の気持ちや行動を分析するといったことが挙げられる.

田中らは,情緒推定へのアプローチの一つとして,「情緒生起原因に着目した手法」を提案した.この手法は,結合価パターン辞書を構築することで,情緒生起原因を明記した特徴(情緒原因)を用言の語義から解析し,情緒を推定する手法である[3].さらに,吾郷らは,不足する情緒原因の特徴を補うために,本辞書に「判断条件」を追加した[4].それに加えて,滝川らは,判断条件において情緒主と情緒対象の関係の方向性である「接近」と「乖離」の関係に注目し,辞書を改良した[5].野口らは,判断条件「保留」と付与された,判断条件が不明確なパターン1,600件に対し,再分析と補修を行った[8].本辞書を用いた情緒推定方法は,もし,入力文と結合価パターンがマッチし,意味属性制約を充足し,かつ,判断条件が成立するならば,対応する情緒属性として「情緒主」,「情緒対象」,「情緒名」を出力するというものである.しかし,この手法は,判断条件における格要素同士の関係を判定する際に,格要素に係る修飾語句を読み捨てている.例えば,「私は美味しいご飯を食べる。」という文も「私は不味いご飯を食べる。」という文も,修飾語句である「美味しい」,「不味い」が捨てられてしまい,同じ情緒が推定されてしまうという問題がある. そこで竹本らは,修飾語句の評価極性を「好評極性」,「不評極性」および「極性なし」の3分類で捉え,それらを利用することで,修飾語句の意味に合わない情緒の推定を抑制するという改良を行った[9].

本研究では,評価極性の算出精度を向上させるため,極性表現を切り替える機能を実装し,夏と冬の状況に応じた評価極性の算出を行う.そして,得られた評価極性を用いて情緒推定を行う.

具体的には,まず,名詞句の種類として「$A$$B$」型名詞句,「形容詞$A$名詞$B$」型名詞句,「形容動詞$A$名詞$B$」を想定し,修飾語句と被修飾語として$T = \{A,B\}$を得る.次に,$T$SO-scoreを算出するための極性表現対を極性表現対知識ベースから得る.ここでのSO-scoreは,一般の人がどう思うかの平均的な値として算出する.そして,「判断条件の接近/乖離の関係」と「名詞句の評価極性」を利用して判断条件の真偽判定を行う.判断条件が接近の関係かつ,名詞句が好評極性,または判断条件が乖離の関係かつ名詞句が不評極性ならば${\boldmath T}$と判定し,判断条件が接近の関係で名詞句が不評極性の時と,判断条件が乖離の関係で名詞句が好評極性の時は${\boldmath F}$と判定する.${\boldmath F}$と判定された場合は,その判断条件が成り立たないものとし,情緒を出力しないことにする.

改良した手法を評価するため,テスト文293文に人手で正解情緒タグを付与して正解データを作成する.次に,同テスト文を自動で情緒推定したものと比較し,精度の調査を行う.

調査の結果,テスト文293文に対し,従来手法で出力された情緒336個のうち一致したものは133個となった.一方,提案手法で出力された情緒311個のうち一致したものは139個となった.情緒の出力数は減り,一致数が増えたため,従来手法に比べて精度が向上した.今後の課題は,本手法をより多くの状況,名詞の種類に適応させること,状況を入力文やその前後文から自動で判別することである.



平成26年3月7日