対義語の抽出

  1. 変換テーブルから英語訳が一致しない($B_i$$\neq$$D_i$となる)日本語単語対(AとC)を抽出する.
  2. 変換テーブル内で対応訳に当たる$A_i$$B_i$(日本語-英語)それぞれについてword2vecを用いて類似度の最も高い日本語単語,英語単語を抽出する.
  3. モデル内の辞書に存在しない単語を含むパターンを除去する.
  4. 抽出された類似度の高い日本語-英語単語の組み合わせと同じ対応が$A_iB_i$ペアに存在すれば対義語と分類する.

Figure: 対義語抽出の手順
\includegraphics[width=15cm]{taigi.eps}