next up previous contents
次へ: 関連研究 上へ: 2013_4 戻る: 表一覧   目次

はじめに

日本語の文法を対象とした様々な研究が行われている[1],[2],[3],[4],[5],[6],[7]. 一般的に,ノンネイティブの日本語学習者にとって,助詞の使い分けは難しいとされている. その中でも副助詞「は」と格助詞「が」の使い分けや,格助詞「に・へ・を・で」の使い分けは特に困難である. 例えば,副助詞「は」と格助詞「が」の使い分けにおいて,「彼は学生だ」と「彼が学生だ」の二文は文法として誤りでなく,かつニュアンスも近い. 田中ら[8]は,「は・が」の使い分けについて「は」は既知情報や説明文,「が」は未知情報や描写文を示すと述べているが,明確な分類法については述べていない.また,Komori[9]は,遷移確率を用いて「は・が」の使い分けの自動推定を行っているが,その他の助詞については推定を行っていない. そこで本研究では,日本語学習者の支援を行うため,使い分けが困難な助詞(「は・が」,「に・へ」,「に・で」,「に・を」)の自動推定を行う. これにより,日本語学習者が助詞の使い分けに迷う場合,どちらを使うべきかを示すシステムを構築可能になる. また,助詞に関わるデータの分析を行うことにより,日本語学習者にとって有用な使い分けのルールを獲得する.

まず,副助詞「は」および格助詞「が」を含む文を京大コーパス3.0[10]から収集し,これらを教師データとして利用する. 次に,同様に別途収集した文から副助詞「は」および格助詞「が」を取り除いた文を収集し,これらをテストデータとして利用する. 収集した教師データからSupport Vector Machine(以下SVM)で分類器を学習し,取り除いた助詞の推定実験を行う. 最後に,教師データを分析し副助詞,格助詞の使い分けのルールを獲得する. 同様の実験を,「に・へ」,「に・を」,「に・で」に対しても行った.

なお,Komori[9]の手法を利用した推定手法を比較手法として用いた.

本研究の主張点は次の3つである.

機械学習(SVM)を用いて助詞「は・が」,「に・へ」,「に・を」,「に・で」の分類を初めて行った.
「は・が」「に・を」「に・で」の使い分けの問題において,比較した手法のなかで機械学習(SVM)が最も高い正解率であった.
実験データを用いた素性の分析によって,助詞の使い分けに役立つ表現を多数獲得した.

本論文の構成は以下の通りである.第2章ではこれまでの助詞に対する研究を説明し,分類を行う各助詞の特徴を説明する. 第3章では本研究で利用するデータを紹介する. 第4章では,助詞を自動推定する手法の説明を行う. 第5章では,助詞の自動推定に対する手法ごと,ならびに分類ごとの評価を行う. 第6章では,素性分析を行い,各助詞の特徴と使い分けに関するルールを獲得する. 第7章では,各助詞の特徴を考察する. 第8章ではまとめを行う.



平成25年2月12日