next up previous contents
次へ: 先行研究 上へ: honron 戻る: 図一覧   目次


はじめに

同義語とは,語形は異なるが意義がほぼ同じである語のことである.例としては「即刻」と「即時」などがある. 同義語に関する研究では,コーパスから同義語を獲得する研究[1][2]や 西尾の人間の会話における同義語の使用傾向を調査し分析する研究[1]などがある. また,小島らは異表記の使い分けを機械学習で行っている[2]. 小島らが機械学習を用いて使い分けを行った対象である異表記とは, 同じ語の表記が異なるもののことであり,「しょう油」と「醤油」が異表記対の例となる. 小島らの研究では,異表記の対を機械学習の対象としているが,同義語全般を対象とはしていない. そこで,本研究はそこに着目し,機械学習を用いて同義語全般の使い分けを行う. 本研究の成果は,文章を生成する際の同義語の選択,適切な表現の使い分けの提案などに利用できると考える.

本研究ではEDR電子化辞書から得られる同義語を利用する.

同義語は意味がほぼ同じであり, 一見同義語は使い分けが必要ないと思いがちだが, 実は使い分けが必要な場合がある. 例えば,「衣類」と「衣料」はEDR電子化辞書では 「体に着るもの」という意味で同義語とされているが, 後ろに「品」をつけることができるのは「衣料」の方のみであり, 後ろに「品」をつける場合は使い分けが必要となる.

本研究では,機械学習による 性能の高い同義語の使い分けも目指すが, 同義語の使い分けが特に必要なものとそれほど必要でないものの分類も試みる. 機械学習によって同義語を推定しやすい場合は,同義語でも使い分けの必要な語とわかり, 逆に機械学習で推定しづらい場合は同義語の使い分けが明瞭でないということがわかる. これらの知見は,同義語の使い分けに役立つと思われる.

本研究の主な主張点を以下に整理する.

本論文の構成は以下の通りである.第2章では,本研究に関連する研究としてどのような研究が行われてきたかを記述し,その研究と本研究との関連を説明する.第3章では,本研究が扱う問題の設定とそれを解決するために提案した手法について説明を行う.第4章では,本研究で使用する同義語対の説明を行う.第5章では,本研究が行った実験についての説明と,その結果について記述する.第6章では,第5章の結果から考察を行う.また,具体的な同義語対の考察も行い,どのような情報が同義語の使い分けに役立ったのかを明らかにする.第7章ではまとめを行う.



平成25年2月19日