next up previous contents
次へ: 最大エントロピー法 上へ: 問題設定と提案手法 戻る: 問題設定   目次


提案手法

本研究では,教師あり機械学習を利用して, 対象語のうちのどの語が文中にあったのかを推定する. 対象語のいずれかを含む文を学習データとして用いる. その文が含む対象語をその文の分類先として,学習を行う. 教師あり機械学習には最大エントロピー法を利用する.

機械学習により同義語の使い分けをより適切に行えたものとそうでないものにわけるために, 機械学習の手法による同義語の使い分けの再現率の高さごとに高・中・低を設定する. 同義語対の語A,語Bの再現率のうち, 低い方の再現率で分類を行う. 再現率の高さごとの分類は,高を再現率8割以上,中を再現率8割未満5割以上,低を再現率5割未満と設定する. 分類に再現率を用いるのは, 再現率は機械学習が実験データのうちどれだけ正解を認識したかという指標であるためである.


平成25年2月19日