next up previous contents
次へ: 素性分析 上へ: 実験 戻る: 実験データ   目次


実験結果

機械学習を利用して「に」「にも」, 「が」「がも」, 「を」「をも」の使い分けの推定を行った. 提案手法の他に, 全て「に」, 「にも」, 「が」, 「がも」, 「を」, 「をも」を推定先とする ベースライン手法による分類推定も行った. 各分類での正解率, マクロ平均 4.1(各分類先での正解率の平均)を 表4.3から表4.5に示す.

表からわかるように, 提案手法は, 「に」「にも」, 「が」「がも」, 「を」「をも」のすべてのマクロ平均において, ベースライン手法の0.5よりも高い値を得ることができた. 「に」「にも」, 「が」「がも」の使い分けでは7割近いマクロ平均を得た. しかし, 「を」「をも」では0.56とありあまり良い結果ではなかった. これは「を」「をも」の学習データ数が少ないことが原因として考えられる.

また, 提案手法での再現率, 適合率, F値での評価を表4.6から表4.8に示す. これらの評価では再現率は5割から7割の値となっているが, 適合率とF値は提案手法の「にも」「がも」「をも」に関して 極端に低い値となってしまう.

これは, 分類先の事例数が他の分類先よりも極端に小さい場合に一般的に生じやすい現象である. 事例数が他の分類先よりも極端に小さい分類先は, 高いF値を取得するのが難しい.

本研究では本来「にも」「がも」「をも」であるものを正しく「にも」「がも」「をも」と推定できた数より, 本来「に」「が」「を」であるものを誤って「にも」「がも」「をも」と推定してしまう数の方が圧倒的に多いため, 適合率の値が非常に低くなってしまう.


表: 「に」「にも」の分類結果
手法 分類先 正解率 マクロ平均  
提案手法 「に」 0.64 (4494/7045) 0.69  
  「にも」 0.74 ( 172/ 233)    
ベースライン手法 「に」 1.00 (7045/7045) 0.50  
全て「に」 「にも」 0.00 ( 0/ 233)    
ベースライン手法 「に」 0.00 ( 0/7045) 0.50  
全て「にも」 「にも」 1.00 ( 233/ 233)    


表: 「が」「がも」の分類結果
手法 分類先 正解率 マクロ平均  
提案手法 「が」 0.65 ( 312/ 480) 0.67  
  「がも」 0.69 ( 49/ 71)    
ベースライン手法 「が」 1.00 ( 480/ 480) 0.50  
全て「が」 「がも」 0.00 ( 0/ 71)    
ベースライン手法 「が」 0.00 ( 0/ 480) 0.50  
全て「がも」 「がも」 1.00 ( 71/ 71)    


表: 「を」「をも」の分類結果
手法 分類先 正解率 マクロ平均  
提案手法 「を」 0.51 ( 841/1641) 0.56  
  「をも」 0.61 ( 17/ 28)    
ベースライン手法 「を」 1.00 (1641/1641) 0.50  
全て「を」 「をも」 0.00 ( 0/ 28)    
ベースライン手法 「を」 0.00 ( 0/1641) 0.50  
全て「をも」 「をも」 1.00 ( 28/ 28)    


表: 「に」「にも」の分類結果(F値)
手法 分類先 再現率 適合率 F値
提案手法 「に」 0.64 (4494/7045) 0.99 (4494/4555) 0.78
  「にも」 0.74 ( 172/ 233) 0.06 ( 172/2723) 0.11
ベースライン手法 「に」 1.00 (7045/7045) 0.97 (7045/7278) 0.98
全て「に」 「にも」 -- ( 0/ 233) -- ( 0/ 0) --
ベースライン手法 「に」 -- ( 0/7045) -- ( 0/ 0) --
全て「にも」 「にも」 1.00 ( 233/ 233) 0.03 ( 233/7278) 0.06


表: 「が」「がも」の分類結果(F値)
手法 分類先 再現率 適合率 F値
提案手法 「が」 0.65 ( 312/ 480) 0.93 ( 312/ 334) 0.77
  「がも」 0.69 ( 49/ 71) 0.23 ( 49/ 217) 0.35
ベースライン手法 「が」 1.00 ( 480/ 480) 0.78 ( 480/ 551) 0.93
全て「が」 「がも」 -- ( 0/ 71) -- ( 0/ 0) --
ベースライン手法 「が」 -- ( 0/ 480) -- ( 0/ 0) --
全て「がも」 「がも」 1.00 ( 71/ 71) 0.13 ( 71/ 551) 0.23


表: 「を」「をも」の分類結果(F値)
手法 分類先 再現率 適合率 F値
提案手法 「を」 0.51 ( 841/1641) 0.99 ( 841/ 852) 0.67
  「をも」 0.61 ( 17/ 28) 0.02 ( 17/ 817) 0.04
ベースライン手法 「を」 1.00 (1641/1641) 0.98 (1641/1669) 0.99
全て「を」 「をも」 -- ( 0/ 28) -- ( 0/ 0) --
ベースライン手法 「を」 -- ( 0/1641) -- ( 0/ 0) --
全て「をも」 「をも」 1.00 ( 28/ 28) 0.02 ( 28/1669) 0.03


next up previous contents
次へ: 素性分析 上へ: 実験 戻る: 実験データ   目次
平成26年4月2日