次へ: 関連研究 上へ: 2013_4 戻る: 表一覧目次

はじめに

日本語の文法を対象とした様々な研究が行われている[1],[2],[3],[4],[5],[6],[7]．一般的に，ノンネイティブの日本語学習者にとって，助詞の使い分けは難しいとされている．その中でも副助詞「は」と格助詞「が」の使い分けや，格助詞「に・へ・を・で」の使い分けは特に困難である．例えば，副助詞「は」と格助詞「が」の使い分けにおいて，「彼は学生だ」と「彼が学生だ」の二文は文法として誤りでなく，かつニュアンスも近い．田中ら[8]は，「は・が」の使い分けについて「は」は既知情報や説明文，「が」は未知情報や描写文を示すと述べているが，明確な分類法については述べていない．また，Komori[9]は，遷移確率を用いて「は・が」の使い分けの自動推定を行っているが，その他の助詞については推定を行っていない．そこで本研究では，日本語学習者の支援を行うため，使い分けが困難な助詞（「は・が」，「に・へ」，「に・で」，「に・を」）の自動推定を行う．これにより，日本語学習者が助詞の使い分けに迷う場合，どちらを使うべきかを示すシステムを構築可能になる．また，助詞に関わるデータの分析を行うことにより，日本語学習者にとって有用な使い分けのルールを獲得する．

まず，副助詞「は」および格助詞「が」を含む文を京大コーパス3.0[10]から収集し，これらを教師データとして利用する．次に，同様に別途収集した文から副助詞「は」および格助詞「が」を取り除いた文を収集し，これらをテストデータとして利用する．収集した教師データからSupport Vector Machine(以下SVM)で分類器を学習し，取り除いた助詞の推定実験を行う．最後に，教師データを分析し副助詞，格助詞の使い分けのルールを獲得する．同様の実験を，「に・へ」，「に・を」，「に・で」に対しても行った．

なお，Komori[9]の手法を利用した推定手法を比較手法として用いた．

本研究の主張点は次の3つである．

１: 機械学習（SVM）を用いて助詞「は・が」，「に・へ」，「に・を」，「に・で」の分類を初めて行った．
２: 「は・が」「に・を」「に・で」の使い分けの問題において，比較した手法のなかで機械学習（SVM）が最も高い正解率であった．
３: 実験データを用いた素性の分析によって，助詞の使い分けに役立つ表現を多数獲得した．

本論文の構成は以下の通りである．第2章ではこれまでの助詞に対する研究を説明し，分類を行う各助詞の特徴を説明する．第3章では本研究で利用するデータを紹介する．第4章では，助詞を自動推定する手法の説明を行う．第5章では，助詞の自動推定に対する手法ごと，ならびに分類ごとの評価を行う．第6章では，素性分析を行い，各助詞の特徴と使い分けに関するルールを獲得する．第7章では，各助詞の特徴を考察する．第8章ではまとめを行う．

平成25年2月12日