機械学習を用いた副詞の類義語の使い分け

中瀬は,機械学習による分類性能の高い副詞の類義語の使い分けの研究を行った[2].

中瀬は副詞の類義語の使い分けに機械学習を使用した.複数の副詞の類義語対を対象に,どの程度使い分けが必要か, またどのような場合に使い分けが必要かなどを新たに示した.

中瀬はEDR電子化辞書と1991年〜1995年の毎日新聞を使用し,副詞の類義語を獲得した. 副詞の類義語を獲得する条件は以下の通りである.

条件1
その二つの語が,日本語単語辞書において,同一の概念識別子をもつこと
条件2
その二つの語が両方とも,日本語単語辞書において,付与された概念識別子が1つであること
条件3
その二つの語が両方とも,1991年〜95年の毎日新聞で出現頻度が50回以上であること
条件4
形態素解析システムJUMAN[10]を用いて解析した結果,その二つの語の代表表記が異なること

獲得した副詞の類義語対について,類義語対ごとに類義語の使い分けの実験を行った.入 力文は,1991年〜95年の毎日新聞から獲得した,類義語対のいずれかの語を含む文である. 評価は10分割のクロスバリデーションで行った. 機械学習の再現率の高さごとに副詞の類義語対を,高・中・低に分類し, 機械学習における素性を分析することで類義語の使い分けに重要な情報を把握した.

中瀬の研究の成果として,機械学習を用いた副詞の類義語の使い分けの手法自体が類義語の使い分けに有効であることを示した. 更に,機械学習での性能に基づき使い分けが必要な副詞の類義語対とそれほど必要でない副詞の類義語対を明らかにした. また,実際に素性を分析した.使い分けに役立つ情報を明らかにし,どのような場合に使い分けの必要があるかを明らかにした. 使い分けが必要な副詞の類義語対として「きわめて」と「だいぶ」,「そっくり」と「すっかり」, 使い分けが必要でない類義語対として「さして」と「さほど」,「すっかり」と「ことごとく」があった.