分類分けが高で置き換え可の値が低かったもの

ここでは分類分けが高で置き換え可の値が低かったものとして,「迎撃」「出撃」と「遅れる」「進む」と「鈍い」「鋭い」と「うっすら」「はっきり」に関して考察する.

まず,「迎撃」「出撃」に関して考察する. 「迎撃」「出撃」は置き換え可と判断された割合は0.27(8/30)である. 表5.1に機械学習の性能を示す.表5.2に機械学習が重要と判断した素性を示す.



Table 5.1: 機械学習の性能(「迎撃」「出撃」)
  データ数 再現率
迎撃 518 93.25%
出撃 518 95.18%




Table 5.2: 機械学習が参考にした性能(「迎撃」「出撃」)
迎撃 出撃
素性 数値 素性 数値
素性1:核 0.9991 素性1:終結 0.9991
素性1:防衛 0.9990 素性1:太平洋 0.9991
素性1:ミサイル 0.9988 素性1:沖縄 0.9989

有用な素性としては,「迎撃」は,「核」「防衛」「ミサイル」など, 戦争に関するものが多く見られた. 以下に例を示す.

「出撃」は「太平洋」「沖縄」など, 戦争の中でも第二次世界大戦に関するものが多かった. これは, 新聞から文を抽出していることが原因の一つだと考える. 以下に例を示す.

置き換え可の値が低い理由としては,「出撃」の文中内での対義語が「迎撃」ではなく「撤退」と置き換えることもできたため, 置き換え可の値が低くなったと考えられる. さらに, 「迎撃」「出撃」は慣用的表現が少なかったからだと考えられる.

次に,「遅れる」「進む」に関して考察する. 「遅れる」「進む」は置き換え可と判断された割合は0.27(8/30)である. 表5.3に機械学習の性能を示す.表5.4に機械学習が参考にした素性を示す.




Table 5.3: 機械学習の性能(「遅れる」「進む」)
  データ数 再現率
遅れる 1000 92.00%
進む 1000 90.30%




Table 5.4: 機械学習が参考にした性能(「遅れる」「進む」)
遅れる 進む
素性 数値 素性 数値
素性1:半島 0.9968 素性1:向き 0.9986
素性1:復興 0.8993 素性1:の 0.8402

有用な素性としては,「遅れる」は,「半島」「復興」など政治に関係するものが見られた.以下に例を示す.

「進む」は「動く」といった意味で使われ, 「遅れる」が対義語でない場合の使われ方が見られた. 以下に例を示す 置き換え可の値が低い理由としては,「進む」は「動く」や「向かう」という意味で使われ, 「遅れる」の対義語として使われていなかったため置き換え可の値が低くなったと考えられる.

次に「鋭い」「鈍い」に関して考察する. 「鋭い」「鈍い」は置き換え可と判断された割合は0.40(13/30)である. 表5.5に機械学習の性能を示す.表5.6に機械学習が参考にした素性を示す.




Table 5.5: 機械学習の性能(「鋭い」「鈍い」)
  データ数 再現率
鈍い 746 93.82%
鋭い 746 94.65%




Table 5.6: 機械学習が参考にした性能(「鈍い」「鋭い」)
鈍い 鋭い
素性 数値 素性 数値
素性1:動き 0.9946 素性1:眼光 0.9955
素性1:人 0.9768 素性1:知性 0.9868
素性1:輝き 0.9288 素性1:追及 0.9826

有用な素性としては,「鈍い」は「人」「輝き」など慣用的な表現が見られた.以下に例を示す.

「鋭い」は「眼光」「知性」「追及」など慣用的な表現が見られた. 以下に例を示す. 置き換え可の値が低くなった理由としては,「鈍い」は「人」「輝き」などの単語とともに使われ, 「鋭い」は「知性」「追及」などの単語とともに使われた。「鋭い」「鈍い」ともに慣用的な表現がよく使われているため置き換え可の値が低くなったと考えられる。

次に「うっすら」「はっきり」に関して考察する. 「うっすら」「はっきり」は置き換え可と判断された割合は0.23(7/30)である. 表5.7に機械学習の性能を示す.表5.8に機械学習が参考にした素性を示す.




Table 5.7: 機械学習の性能(「うっすら」「はっきり」)
  データ数 再現率
うっすら 397 95.70%
はっきり 397 92.26%




Table 5.8: 機械学習が参考にした性能(「うっすら」「はっきり」)
うっすら はっきり
素性 数値 素性 数値
素性1:染 0.9992 素性1:結果 0.9981
素性1:汗 0.9991 素性1:依然 0.9984
素性1:涙 0.9990 素性1:態度 0.9979
素性1:雪 0.9970 素性1:追及 0.9826

有用な素性としては,「うっすら」は「染」「汗」「涙」「雪」などの単語と同時に出現しやすいことが見られた.以下に例文を示す.

また,「うっすらと染まる」「うっすらと見える」という表現が多く見られた. 「はっきり」は「結果」「依然」「態度」などの単語と同時に出現しやすいことが見られた.以下に例文を示す. また,「はっきりする」「はっきりとした」という表現が多く見られた. 置き換え可の値が低くなった理由としては,「うっすら」は「光」や「雪」などのような単語とともに使われ,「うっすらと見える」「うっすらと染まる」という慣用的な表現が多く使われていた. 「はっきり」は「はっきりする」という慣用的な表現がとてもよく使われており,ともに慣用的な表現がよく使われているため置き換え可の値が低くなったと考えられる.

分類分けが高で置き換え可の値が低かったものとして「迎撃」「出撃」と「進む」「遅れる」と「鋭い」「鈍い」と「うっすら」「はっきり」を考察した.その結果,分類分けが低で置き換え可の値が高かったものの特徴として,佐々本ら[3]と同様に以下のようなものが見られた.