next up previous contents
次へ: 関連研究 上へ: soturon5 戻る: 表一覧   目次


はじめに

既存の日本語文は, 作文のための手本ととらえることができる. 既存の大量の日本語文を, 教師あり機械学習で分析することにより, 日本語文法[1][2][3][4][5]に関わる様々な知見を得ることができる. 例えば, 林ら[6]は日本語文章における文の順序を 教師あり機械学習を用いて研究することにより, 文の順序に関わる知見を得ている. 三浦ら[7][7]は日本語の格助詞の使い分けを 教師あり機械学習を用いて研究することにより, 格助詞の使い分けに関わる知見を得ている.

本研究では, 三浦らの研究[7][8]で取り上げられなかった 助詞「も」に対して, 教師あり機械学習を用いることにより, いくつかの場合の助詞「も」の使い分けを行い, 助詞「も」に関わる知見を得ることを目指す.

助詞「も」の使い分けを分析しそれに関する知見を 得ることは, 以下の二つのことに役立つと思われる. 一つは, 助詞「も」に関わる知見により 助詞「も」の誤った使用の検出技術の構築につながる. もう一つは, 日本語文法の課題の一つである助詞「も」に関わる知見 を増やすことにより, 日本語文法に関わる研究の推進につながる.

本研究で強調したいことをあらかじめまとめておくと以下のようになる.

  1. 本研究では教師あり機械学習を用いて助詞「も」の使い分け問題に取り組んだ.
  2. 「も」の使い分け問題ではデータ数を拡張することにより, 7割から8割の正解率を得ることができた.
  3. 文脈素性を使わない実験を行うことで, 「も」の使い分けに文脈素性が必要であることがわかった.
  4. 教師あり機械学習に用いた素性の分析により「も」の文中での使用における特徴を得ることができた.

本論文の構成は以下の通りである. 第2章では, 本研究に関連する研究としてどのような研究が行われてきたかを記述し, その研究と本研究との関連を説明する. 第3章では, 本研究が扱う問題の設定と それを解決するために提案した手法について説明を行う. 第4章では, 本研究で行った実験の実験結果とその考察を記述する. さらに, 追加で行った二つの実験の方法とその結果を記述する. 第5章ではまとめを行う.



平成26年4月2日