分類分けが低だが置き換え可の値が低かったもの

ここでは分類分けが低だが置き換え可の値が低かったものとして,置き換え可の値が低かった「固まる」「溶ける」と「憎い」「いとしい」に関して考察する.

まず, 「憎い」「いとしい」に関して考察する. 「憎い」「いとしい」は置き換え可と判断された割合は0.40(12/30)である. 表5.15に機械学習の性能を示す.表5.16に機械学習が参考にした素性を示す.




Table 5.15: 機械学習の性能(「憎い」「いとしい」)
  データ数 再現率
憎い 97 78.52%
いとしい 97 77.37%




Table 5.16: 機械学習が参考にした性能(「憎い」「いとしい」)
憎い いとしい
素性 数値 素性 数値
素性1:犯人 0.9936 素性1:妻 0.9739
素性2:が 0.9714 素性1:娘 0.9559

データ数が少なかったのであまり有用な素性が得られなかった. 有用な素性としては,「憎い」は直前に「が」が来て「…が憎い」という表現や「犯人」などが見られた.

「いとしい」に関しては,直後に名詞が来て「いとしい…」という表現や,「娘」などが見られた.以下に例文を示す. などがあった.「…が憎い」や「いとしい…」という表現は対義語に置き換えても問題無い.よって,この2つの表現はそれぞれの対義語対の使われやすい表現ではあるが慣用的な表現ではない.

置き換え可の値が低くなってしまった原因としては,多義性により,「憎い」の文中内での対義語が「いとしい」ではなく「好ましい」と判断されたものがあったため置き換え可の値が低くなったと考えられる.使い方に関しては,よく使われる慣用的な表現もなく,文法的な使い方の違いもなかった.

次に「固まる」「溶ける」に関して考察する. 「固まる」「溶ける」は置き換え可と判断された割合は0.10(3/30)である. 表5.17に機械学習の性能を示す.表5.18に機械学習が参考にした素性を示す.




Table 5.17: 機械学習の性能(「固まる」「溶ける」)
  データ数 再現率
固まる 176 77.27%
溶ける 176 88.70%




Table 5.18: 機械学習が参考にした性能(「固まる」「溶ける」)
固まる 溶ける
素性 数値 素性 数値
素性1:意見 0.8270 素性1:輝き 0.9799
素性1:考え 0.7582 素性1:疲れ 0.6145

「固まる」「意見」や「考え」が「固まる」という表現や, 「集まる」の意味の「固まる」といった表現のような, 「溶ける」の対義語ではない使われ方がされていた. 以下に例文を示す.

「溶ける」に関しては, 「役に溶ける」「疲れが溶ける」といった慣用的な表現が得られた。

置き換え可の値が低くなってしまった原因としては,「固まる」は「集まる」や「決まる」といった「溶ける」の対義語ではない使われ方が多くされていたためと考えられる.

分類分けが高で置き換え可の値が高かったものとして「沸かす」「冷やす」と「憎い」「いとしい」と「まだ」「もう」を考察した.その結果,分類分けが低だが置き換え可の値が低かったものの特徴として,佐々本ら[]と同様に以下のようなものが見られた.