next up previous contents
Next: 謝辞 Up: honron1 Previous: 「場合」「時」「際」での実験   目次

おわりに

本研究では機械学習を用いて類義語の使い分けの研究を行った.本研究の成果は2つある.

第1の成果として,類義語11組について実験を行った結果,正解率のマクロ平均は「データ数を出現率に合わせた実験」では,提案手法が0.84,ベースライン手法が0.65,素性2のみの手法では0.82であり,「データ数を同数に揃えた実験」では,提案手法が0.81,ベースライン手法が0.42,素性2のみの手法では0.78であったため,機械学習を用いる提案手法の正解率が最も頻度の高い語を常に選択するベースライン手法と機械学習の素性を前後の3単語のみとした手法よりも,高いことを確認した.これにより,今回提案した手法自体が類義語の使い分けに対して有用であると考えられる.

第2の成果として,類義語の組について素性を分析し,使い分けに役立つ素性が多く得られた.例えば,「作成」は「表」「リスト」などを作る時に使われ,「作製」は「細胞」「遺伝子」などを作る時に使われることが多い.また,「おおよそ」は助詞の付属語を伴い,修飾先が名詞の時に使われることが多いのに対し,「おおむね」は形容詞が修飾先の時に使われることが多いなどの文献[5][6]に載っていないような使い分けに関する情報が多く得られた.使い分けに役立つ情報を明らかにし,さらにどのような場合に使い分けの必要があるかを明らかにすることができた.



root 2018-02-28