next up previous contents
次へ: 結合価パターン辞書を用いた情緒推定 上へ: soturon16_1 戻る: 表一覧   目次

はじめに

言語の意味理解の一つとして,言語表現から書き手や話者,登場人物の情緒を推 定する技術に期待が寄せられている. なぜなら,この技術はテキストマイニングとして応用できる可能性もあるからである.例えば,ブログや口コミ掲示板などに蓄積された テキストデータを情緒推定することで,企業の商品やサービスに対する 消費者の気持ちを知るといったことが考えられる.

これに対して,情緒推定へのアプローチとしては,「情緒の明示的な表現に着目し た手法」と「情緒 生起の原因に着目した手法」がある. 前者については,感情を表すことができる副詞・形容詞の解析 [1]や,情緒を明示的に表す用言に注目し た情緒推定[2]がある.一方,後者については 結合価パターン辞 書を構築することで用言の語義から情緒の生起原因を明記した特徴(情緒原因) を解析し,情緒を推定する手法がある[3]. しかし,この手法において,結合価パターン辞書は用言の語義から情緒の生起原 因を明記した特徴の一部分しか解析できない.用言の語義で解析できなかった特 徴は,語義により非保証のままであり,他の手法によっ て保証する必要がある.

例えば,解析対象文として(i)「給与を貰う」 や(ii)「石ころを貰う」という文があった場合に,(i)と(ii)は共にマッチしたパターンより情緒原因 〈獲得〉が解析され,情緒《喜び》が推定される.しかし,実際には, (i)は情緒《喜び》を推定してもよいが,(ii)は推定しない方 がよい. 現状では,計算機が(i)と(ii)で共に情緒《喜び》を推定してしまう理由として, 〈獲得〉の特徴「目標実現に必要な物事を手に入れた」のうち,用言の語 義は物事を手に入れたことは保証しているが,目標実現に必要な物事なのかや, 努力したのかなどは非保証であることが挙げられる.

語義で非保証の特徴を保証するための手法としては,文脈解析を用いる方法や,一般常識を用 いる方法がある. 文脈解析を用いる方法として,先行研究[4][5]では前提条件を導入した.前提 条件には,情緒原因の特徴が複数の条件に分けられて記載されており,文脈情報 から前提条件を満足するかどうか調べた上で,情緒の成立/不成立を判断できる ようにした.

一方,文脈情報に頼った情緒推定ではなく,一般知識に依存した情緒推定の方法 として, Liu[6]は,コーパスにおいて英文で表現された一般常識を6種類の情緒へ評 価値をつけて分類することで,一般常識と情緒の共起関係を示したモデルを構築 した.しかし,格要素が省略された場合に,正しく解析を行えないことが問題で ある.

そこで本研究では,結合価パターン辞書に判断条件を補強することを目的とする. 判断条件とは,語義が非保証の特徴を保証するための条件である. この判断条件を用いると,格要素が省略された場合でも,正しい特徴をもつ結合 価パターンを解析することができると考えられる.判断条件は結合価パターン中 の格要素同士を関係づけることで表現する.そして,Webデータより,判断条件 と情緒との共起関係を調べ,一般常識として判断情報知識ベースに蓄積する.それぞれ の判断条件について情緒が成立する件数が成立しない件数より多ければ,語義が 非保証の特徴を保証できると判断する.逆に,情緒が成立する件数より,成立しない件数が 多い場合は,語義が非保証の特徴を保証できないと判断する.

そのためには,まず,判断 条件を設計する.そして,判断条件を先行研究[4]で構築された結合価パターン辞書の11,723件のセッ トに対して,人手で追加する.その後,以上の試みに対して,以下に述べる評価を 行う. まず,判断条件の付与精度について 調査する.その後,判断条件を付与したセットの一部分に対して,判断条件によって関係づけた格要素同士の関 係が成立するか否か,Webデータを活用して統計的に判定する手法を試みる.

本論文の構成は以下の通りである.第2章では結合価パターン辞書と 情緒推定について具体的に述べる.第3章では判断条 件の設計手順と付与例を示す.第4章では結合価パターン辞書に追加した情報 の付与精度について調査し,誤り分析を行う.第5章で判断条件を用いた情緒推 定の実現可能性について言及し,第6章でまとめと今後の課題について述べる.



平成20年3月21日