next up previous contents
Next: 10分割クロスバリデーション Up: 本研究の手法 Previous: 本研究の手法   目次

本研究の多義性解消の方法

本研究では,先行研究[4]で提案されている手法と類似した手法を用いる.言い換えと機械学習を利用して多義性解消を行う手法を用いる.多義性解消の入力は,多義語を含む文であり,出力は,複数ある語義のうち,どの意味で使われたかとする.先行研究[5]と同様に学習データを用いた教師あり機械学習により,多義語の語義を1つに絞る.しかし,学習データが少ない場合,多義性解消を誤りやすい.そこで本研究では,言い換えを利用して学習データを自動で増やし,その増やした学習データを利用する[4].言い換えを利用して学習データを増やすには,対象の多義語の類義語を含む文を抜き出し,その類義語を対象の多義語に言い換えることにより学習データを増やすことができる.学習に使用する素性は48種類で,文構造や文中にある単語などを素性とする.機械学習には最大エントロピー法を利用する.



Yuma Toda 2018-02-27