メールやブログ等のテキストコミュニケーションにおいて, 用いられる口調のきつさを判定する技術が必要である. この背景として,近年では小学生等の低年齢層も 日常的にEメールやインターネットを利用しているという事情がある. きつい口調は相手を傷付けたり不快にさせたりする可能性が高く, トラブルの原因になることも有り得るが, 幼い子どもは言語的に未熟であり, 表現の持つきつさに対する知識が少ないと考えられる. しかし,口調のきつさを機械的に判定することが出来れば, このような問題を解決できる.
きつさを判定する手がかりとして, 言語表現に伴う話者の情緒を用いることが有効であると考えられる. 常識的に考えて,きつい口調には怒りや嫌悪感などの攻撃的な情緒が伴いやすいため, どのような表現がどのような情緒と共に用いられるか, という点についての知識があると良い. 日本文の発話において,話者の情緒や意図といった心的態度は, 助詞や助動詞といった形で文末に表れ得るとされている[1]. 同じ事を述べる場合でも,文末表現が違うと印象が異なるのは, 心的態度の違いよるものと言えよう. しかし,口調のきつさと文末表現の関係について,定量的な評価はまだ行われていない. これは,文末表現の情緒的傾向を定量的に計測することのできる辞書が 開発されていなかったためである.
例えば人に物を頼む時に使う「〜してよ。」という表現が, 怒った時に使われることが多いのか, あるいは期待感を伴って使われることが多いのか, 定量的には示されていない. 過去の研究例として,『日本語文型辞典』[2]では, 文末表現に関する解説も示されているが, 使用方法や使用場面に関する記述が中心であり, きつさ判定への応用には向かない.
情緒的傾向を定量的に示すことができると何が良いのかと言うと, きつい口調で書かれた文章の情緒的傾向と きつくない口調で書かれた文章の情緒的傾向を定量化し, 両者に明確な違いがあれば機械的な見分けを行うことが可能となる. そこで,本研究では,情緒傾向値付き文末表現パターン辞書の開発を目的とする. その方法として,まず,タグ付きテキスト対話コーパスを構築し, そのコーパスをもとに,情緒との共起頻度の情報をもつ文末表現パターンを作成し, 辞書化する.そして,口調のきつさを文末表現で定量的に評価することの 可能性と妥当性を,実験により確認する.
本論文の構成は以下の通りである. まず第2章で関連研究について説明し,本研究のアプローチについて述べる. 第3章でタグ付きテキスト対話コーパスの構築について示す. 第4章で文末表現パターン辞書の作成について示し, 作成した辞書の引き方を第5章で示す. そして,第6章で辞書の評価実験について示し, 第7章で考察を行う.最後に,第8章で 本研究をまとめる.