次へ: 関連研究
上へ: 2013_4
戻る: 表一覧
目次
日本語の文法を対象とした様々な研究が行われている[1],[2],[3],[4],[5],[6],[7].
一般的に,ノンネイティブの日本語学習者にとって,助詞の使い分けは難しいとされている.
その中でも副助詞「は」と格助詞「が」の使い分けや,格助詞「に・へ・を・で」の使い分けは特に困難である.
例えば,副助詞「は」と格助詞「が」の使い分けにおいて,「彼は学生だ」と「彼が学生だ」の二文は文法として誤りでなく,かつニュアンスも近い.
田中ら[8]は,「は・が」の使い分けについて「は」は既知情報や説明文,「が」は未知情報や描写文を示すと述べているが,明確な分類法については述べていない.また,Komori[9]は,遷移確率を用いて「は・が」の使い分けの自動推定を行っているが,その他の助詞については推定を行っていない.
そこで本研究では,日本語学習者の支援を行うため,使い分けが困難な助詞(「は・が」,「に・へ」,「に・で」,「に・を」)の自動推定を行う.
これにより,日本語学習者が助詞の使い分けに迷う場合,どちらを使うべきかを示すシステムを構築可能になる.
また,助詞に関わるデータの分析を行うことにより,日本語学習者にとって有用な使い分けのルールを獲得する.
まず,副助詞「は」および格助詞「が」を含む文を京大コーパス3.0[10]から収集し,これらを教師データとして利用する.
次に,同様に別途収集した文から副助詞「は」および格助詞「が」を取り除いた文を収集し,これらをテストデータとして利用する.
収集した教師データからSupport Vector Machine(以下SVM)で分類器を学習し,取り除いた助詞の推定実験を行う.
最後に,教師データを分析し副助詞,格助詞の使い分けのルールを獲得する.
同様の実験を,「に・へ」,「に・を」,「に・で」に対しても行った.
なお,Komori[9]の手法を利用した推定手法を比較手法として用いた.
本研究の主張点は次の3つである.
- 1
- 機械学習(SVM)を用いて助詞「は・が」,「に・へ」,「に・を」,「に・で」の分類を初めて行った.
- 2
- 「は・が」「に・を」「に・で」の使い分けの問題において,比較した手法のなかで機械学習(SVM)が最も高い正解率であった.
- 3
- 実験データを用いた素性の分析によって,助詞の使い分けに役立つ表現を多数獲得した.
本論文の構成は以下の通りである.第2章ではこれまでの助詞に対する研究を説明し,分類を行う各助詞の特徴を説明する.
第3章では本研究で利用するデータを紹介する.
第4章では,助詞を自動推定する手法の説明を行う.
第5章では,助詞の自動推定に対する手法ごと,ならびに分類ごとの評価を行う.
第6章では,素性分析を行い,各助詞の特徴と使い分けに関するルールを獲得する.
第7章では,各助詞の特徴を考察する.
第8章ではまとめを行う.
平成25年2月12日