表5.16に類義語の組「予想」「予測」の機械学習の分類結果を示す. 表5.17に類義語の組「予想」「予測」の有意差検定に基づいた機械学習が参考にした素性を示す. 表5.18に類義語の組「予想」「予測」の正規化α値に基づいた機械学習が参考にした素性を示す.
データ数 | 再現率 | 適合率 | F値 | |
予想 | 5000 | 0.81 | 0.82 | 0.81 |
予測 | 5000 | 0.82 | 0.81 | 0.81 |
総数 | 10000 | 0.81 | 0.81 | 0.81 |
予想 | 予測 | ||||||
素性 | 頻度(p値) | 素性 | 頻度(p値) | ||||
素性2:さ(直後) | 2034 | 素性2:する(直後) | 496 | ||||
( ) | ( ) | ||||||
素性2:れる(2語後) | 1430 | 素性1:地震 | 373 | ||||
( ) | ( ) | ||||||
素性2:以上(直後) | 318 | 素性1:システム | 168 | ||||
( ) | ( ) | ||||||
素性2:外(直後) | 247 | 素性1:データ | 139 | ||||
( ) | ( ) | ||||||
素性1:業績 | 193 | 素性2:拡散(直前) | 71 | ||||
( ) | ( ) |
予想 | 予測 | ||
素性 | 正規化 値 | 素性 | 正規化 値 |
素性1:相場 | 0.85 | 素性1:在庫 | 0.85 |
素性1:利益 | 0.84 | 素性1:原発 | 0.84 |
素性1:競馬 | 0.80 | 素性1:科学 | 0.80 |
素性1:値動き | 0.74 | 素性1:災害 | 0.76 |
デフォルト素性 | 0.57 | 素性1:豪雨 | 0.75 |
「予想」は「予想される」という表現が多いのに対し,「予測」は「予測する」という表現が多かった.また,「予想外」や「予想以上」のように直後に「外」「以上」がある場合,「予想」と書く使い分けが存在することがわかる.「予想」は「業績」「競馬」「値動き」など幅広く物事を推測する場合に使われ,「予測」は「地震」「豪雨」などの災害を推測することに使われやすい.また,「システム」「データ」「科学」などから「予測」は科学的根拠に基づく推測に使われるとわかる.
また,文献[5]によると以下のように書かれている.
「予測」「予想」は将来のことを前もって見当をつけて,どうなるかを推測することだが,「予測」のほうが,データなどに基づきより具体的であることが多い.
文献[5]と素性分析の結果を比較し同じ結果となったことを以下に示す.「予想」は「システム」「データ」「値動き」のようにデータに基づいたことには「予測」を使うということが同じであった.
文献に載っておらず,素性分析から新たにわかったことを以下に示す.「予想」は「される」,「予測」は「する」というような表現が多かった.また,「予想」は「相場」「利益」「競馬」「値動き」など「お金」が関わっていることによく使われ,「予測」は「地震」「豪雨」などの災害を推測することに使われることが新たにわかった.
文献に載っているが素性分析からは得られなかったことはなかった.