提案手法
本研究では,教師あり機械学習を利用して,対象語のうちのどの語が文中にあったのかを推定し,その結果を用い置き換えの可否を判定する.
対象語のいずれかを含む文を学習データとして用いる.
その文が含む対象語をその文の分類先として,機械学習を用いて学習を行う.
教師あり機械学習には最大エントロピー法を利用する.
再現率の高さごとに結果を高(90%以上)と中(80%以上90%未満)と低(80%未満)の3つに分類し,高が置き換えしにくいもの,低が置き換えしやすいもの,中がそれらの中間として,置き換え可否の判定を行う.
分類に再現率を用いるのは, 再現率は機械学習が実験データのうちどれだけ正解を認識したかという指標であるためである.