類義語とは,語形は異なるが意義がほぼ同じである語のことである.類義語間においては,使い分けが必要な場合がある. 例えば「探し回る」と「探し求める」という類義語対では, 「探し回る」は「時間」「日」といった短い時間を表す場合に用いられることが多いが,「長年」「旅」といった長い時間を表す場合には「探し求める」が用いられる.また,「あちこち探し回る」とは表現するが,「あちこち探し求める」とは普通表現しない. ある類義語対での機械学習の性能が高く,より正確に使い分けを行えていた場合は, その類義語対は特に使い分けの必要な類義語対とわかり,機械学習での性能が低かった類義語対は, それほど使い分けの必要がないと推定できる.
また,機械学習が使用した素性を分析して,動詞・形容詞の類義語の使い分けに役立つ情報の考察も行う. このような実験と調査を既存の辞書から獲得できた動詞・形容詞の類義語対を対象に行う. 本研究の成果は2つある.1つ目は,今回行った機械学習の性能がよく, 動詞22対,形容詞10対の類義語対を用いた実験において, 類義語のうち最も頻度の高い語を常に選択するベースライン手法の正解率が動詞では0.77,形容詞では0.70 であるのに対して, 機械学習を用いる提案手法は動詞では0.88,形容詞では0.81の正解率であった. 提案手法には,ベースライン手法よりも高いという有用性がある.
2つ目は,動詞・形容詞の類義語対ごとの機械学習の性能に基づき,動詞・形容詞の類義語対を使い分けが必要なものとそれほど必要でないものに分類したことである. 今回の実験で,特に使い分けが必要であるとされた動詞・形容詞の類義語対に「探し回る」と「探し求める」や「易しい」と「手軽い」などがあった. また,いくつかの類義語対について実際に使い分けに役立つ情報を明らかにした.