次へ: 「に・へ」の使い分け
上へ: 考察
戻る: 機械学習を用いた分析の利点と欠点
目次
素性の取捨に基づく分析による素性分析の結果,「は・が」の分類の際に素性群「述部,体言の文節,以外体言,品詞,直,文脈情報」が有効であるとわかった.
また,頻度分析による素性分析の結果,「述部,係り先,体言の文節,N以外体言,分類」の各ルールは10以上獲得できた.これらは素性として有効であると予測される.
両分析の共通する素性は「述部,体言の文節,N以外体言」であることがわかった.
田中ら[8]は,「は・が」の使い分けについて「は」は既知情報,「が」は未知情報を表すと述べている.
本研究では,素性の取捨に基づく分析による素性分析の結果から有効な素性として「文脈情報」が得られており,先行研究の結果と一致する.
「は・が」の使い分けが必要な文の比率の調査から,10文に9文は使い分けが
必要であることがわかった.
平成25年2月12日