Next: 先行研究
Up: honron
Previous: 表目次
目次
類義語とは,語形は異なるが意義がほぼ同じである語のことである.例としては「探し回る」と「探し求める」などがある.
類義語に関する研究では,コーパスから類義語を獲得する研究[1]や 西尾の人間の会話における類義語の使用傾向を調査し分析する研究[2]などがある.
また,小島らは異表記の使い分けを機械学習で行っている[3].
小島らが機械学習を用いて使い分けを行った対象である異表記とは, 同じ語の表記が異なるもののことであり,
「しょう油」と「醤油」が異表記対の例となる.
小島らの研究では,異表記の対を機械学習の対象としているが,類義語全般を対象とはしていない.
また,強田,中瀬らはEDR電子化辞書から得られる類義語を利用し,機械学習による分類性能の高い名詞・副詞の類義語の使い分けの研究を行っている[4,5].
本研究では,機械学習の性能や素性が類義語の使い分けに役立つと考え,機械学習を用いて動詞・形容詞の類義語の使い分けを行う.
本研究の成果は,文章を生成する際の類義語の選択,適切な表現の使い分けの提案などに利用できると考える.
本研究ではEDR電子化辞書から得られる動詞・形容詞の類義語を利用する.
類義語間においては,使い分けが必要な場合がある.類義語とは,語形は異なるが意義がほぼ同じである語のことである.
例えば「探し回る」と「探し求める」という類義語対では,
「探し回る」は「時間」「日」といった短い時間を表す場合に用いられることが多いが,「長年」「旅」とといった長い時間を表す場合には「探し求める」が用いられる.また,「あちこち探し回る」とは表現するが,「あちこち探し求める」とは普通表現しない.
本研究では,機械学習によって動詞・形容詞の類義語の使い分けも目指すが, 動詞・形容詞の類義語の使い分けが特に必要なものとそれほど必要でないものの分類も試みる.
機械学習によって類義語を推定しやすい場合は,類義語でも使い分けの必要な語とわかり,
逆に機械学習で推定しづらい場合は類義語の使い分けが明瞭でないということがわかる.
これらの知見は,動詞・形容詞の類義語の使い分けに役立つと思われる.
本研究の主な主張点を以下に整理する.
- 本論文は類義語の使い分けのために機械学習を使用し,複数の動詞・形容詞の類義語対について,どの程度使い分けが必要か,
またどのような場合に使い分けが必要かなどを示した.
- 機械学習に基づき動詞・形容詞の類義語の使い分けを行った.
動詞22対,形容詞10対の類義語対を用いた実験において,
類義語のうち最も頻度の高い語を常に選択するベースライン手法の正解率が動詞では0.77,形容詞では0.70 であるのに対して,
機械学習を用いる提案手法は動詞では0.88,形容詞では0.81の正解率であった.
提案手法には,ベースライン手法よりも高いという有用性がある.
- 機械学習における素性(学習に用いる情報のこと)を分析することで動詞・形容詞の類義語の使い分けに重要な情報を把握することができる.
いくつかの類義語について実際に素性を分析し,使い分けに役立つ情報を明らかにした.
例として,「探し回る」と「探し求める」といった類義語対では「時間」「日」といった短い時間を表す場合は「探し回る」を用いるが,「長年」「旅」といった長い時間を表す場合は「探し求める」を使う.
本論文の構成は以下の通りである.
第2章では,本研究に関連する研究としてどのような研究が行われてきたかを記述し,その研究と本研究との関連を説明する.
第3章では,本研究が扱う問題の設定とそれを解決するために提案した手法について説明を行う.
第4章では,本研究で使用する動詞・形容詞の類義語対の説明を行う.
第5章では,本研究が行った実験についての説明と,その結果について記述する.
第6章では,第5章の結果から考察を行う.
また,具体的な類義語対の考察も行い,どのような情報が類義語の使い分けに役立ったのかを明らかにする.
第7章ではまとめを行う.
2018-03-09