next up previous contents
Next: 目次 Up: honron1 Previous: honron1   目次

概要

本研究は類義語に対して,教師あり機械学習を用いることにより,類義語の使い分けを行う.類義語の使い分けに関わる知見を得ることを目指す.

類義語とは,語形は異なるが意義がほぼ同じである語のことである.類義語間においては,使い分けが必要な場合がある. 例えば「おおよそ」と「おおむね」という類義語の組では,「おおよその目安」とはいうが,「おおむねの目安」とはいわない. 強田ら[1]はEDR電子化辞書から得られた名詞の類義語を利用し,機械学習を用いた名詞の類義語の使い分けの研究を行った.また,中瀬[2]は強田らと同様の手法で副詞の類義語の使い分けの研究を行った. ある類義語間での機械学習の性能が高く,より正確に使い分けを行えていた場合は,その類義語の組は特に使い分けの必要な類義語とわかる.また,機械学習が使用した素性を分析して,類義語の使い分けに役立つ情報の考察を行う. このような実験と調査を既存の辞書から獲得した類義語の組を対象に行う.

本研究の成果は2つある.1つ目は,類義語11組について実験を行った結果,正解率がマクロ平均で約8割の性能が得られたため,この提案手法自体が類義語の使い分けに対して有用であることが挙げられる. もう1つは,いくつかの類義語について実際に使い分けに役立ったと思われる情報を明らかにしたことである. 特に,類義語の使い分けに関する文献に載っていないような新たな知見が多く得られた.例えば,「作成」は「表」「リスト」などを作る時に使われ,「作製」は「細胞」「遺伝子」などを作る時に使われるなどの素性を得られた. また,品詞間における類義語の使い分けに関する特徴も得られた. この2つの成果は,文章を生成する際の類義語の選択,適切な表現の使い分けの提案に利用できる.


root 2018-02-28