Next: 言い換えと機械学習を用いた日本語単語の多義性解消
Up: 先行研究
Previous: 多義性解消の誤りの原因
目次
Mihalcea[4]らは,単義の同義語を利用し,学習データを自動獲得する方法を提案した.英語の概念辞書(意味辞書)の同義語のうち,単義語や,定義文の一部を利用しWeb 検索を行い,獲得したスニペット中の対象語に語義を付与し,テストデータに追加した.スニペットとは,検索エンジンによる検索結果の一部として表示される、Webページの要約文のことである。この方法であれば,テストデータにしか出現しない語義は,同義語を用いた訓練データの拡張を行うことで,推定できる可能性がある.
Yuma Toda
2018-02-27