機械学習を用いた動詞と形容詞の類義語の使い分け

織金は,機械学習を用いて動詞と形容詞の類義語の使い分けの研究を行った.

織金は動詞と形容詞の類義語の使い分けに機械学習を使用した.複数の副詞の類義語対を対象に,どの程度使い分けが必要か, またどのような場合に使い分けが必要かなどを新たに示した.

織金は動詞類義語対獲得にはEDR電子化辞書と1991年〜1995年の5年分の毎日新聞を,形容詞類義語対獲得には上記の年数に加えて2011年から2015年の10年分の毎日新聞を使用し,動詞と形容詞の類義語を獲得した. 動詞,形容詞の類義語を獲得する条件は以下の通りである.

条件1
その二つの語が,日本語単語辞書において,同一の概念識別子をもつこと
条件2
その二つの語が両方とも,1991年〜95年の毎日新聞で出現頻度が50回以上であること,また,形容詞では1991年から1995年と2011年から2015年の10年分の新聞で出現頻度が20回以上であること
条件3
形態素解析システムJUMAN[10]を用いて解析した結果,その二つの語の代表表記が異なること

獲得した動詞と形容詞の類義語対について,類義語対ごとに類義語の使い分けの実験を行った. 入力文は,動詞の類義語対獲得には1991年〜1995年の5年分の毎日新聞を,形容詞の類義語対獲得には上記の年数に加えて2011年から2015年の10年分の毎日新聞から獲得した,類義語対のいずれかの語を含む文である. 評価は10分割のクロスバリデーションで行った. 機械学習の再現率の高さごとに動詞と形容詞の類義語対を,高・中・低に分類し, 機械学習における素性を分析することで類義語の使い分けに重要な情報を把握した.

織金の研究の成果として,機械学習を用いた動詞と形容詞の類義語の使い分けの手法自体が類義語の使い分けに有効であることを示した. 更に,機械学習での性能に基づき使い分けが必要な動詞と形容詞の類義語対とそれほど必要でない動詞と形容詞の類義語対を明らかにした. また,実際に素性を分析した.使い分けに役立つ情報を明らかにし,どのような場合に使い分けの必要があるかを明らかにした. 使い分けが必要な動詞と形容詞の類義語対として「探し回る」と「探し求める」,「近しい」と「むつまじい」, 使い分けが必要でない動詞と形容詞の類義語対として「はみ出る」と「はみ出す」,「気まずい」と「面はゆい」があった.