提案手法

本研究では,教師あり機械学習を利用して,対象語のうちのどの語が文中にあったのかを推定し,その結果を用い置き換えの可否を判定する. 対象語のいずれかを含む文を学習データとして用いる. その文が含む対象語をその文の分類先として,機械学習を用いて学習を行う. 教師あり機械学習には最大エントロピー法を利用する. 再現率の高さごとに結果を高(90%以上)と中(80%以上90%未満)と低(80%未満)の3つに分類し,高が置き換えしにくいもの,低が置き換えしやすいもの,中がそれらの中間として,置き換え可否の判定を行う.

分類に再現率を用いるのは, 再現率は機械学習が実験データのうちどれだけ正解を認識したかという指標であるためである.