y表5.19に類義語の組「おおよそ」「おおむね」の機械学習の分類結果を示す. o表5.20に類義語の組「おおよそ」「おおむね」の有意差検定に基づいた機械学習が参考にした素性を示す. 表5.21に類義語の組「おおよそ」「おおむね」の正規化α値に基づいた機械学習が参考にした素性を示す.
データ数 | 再現率 | 適合率 | F値 | |||
おおよそ | 937 | 0.88 | 0.91 | 0.90 | ||
おおむね | 937 | 0.92 | 0.88 | 0.90 | ||
総数 | 1874 | 0.90 | 0.90 | 0.90 |
おおよそ | おおむね | ||||||
素性 | 頻度(p値) | 素性 | 頻度(p値) | ||||
素性32:名詞 | 705 | 素性32:動詞 | 594 | ||||
( ) | ( ) | ||||||
素性5:助詞 | 466 | 素性32:形容詞 | 109 | ||||
( ) | ( ) | ||||||
素性2:の(直後) | 417 | 素性31:妥当だ | 18 | ||||
( ) | ( ) | ||||||
素性2:の(直前) | 78 | 素性2:好評(直後) | 16 | ||||
( ) | ( ) | ||||||
素性31:見当 | 20 | 素性2:満足(直後) | 10 | ||||
( ) | ( ) |
おおよそ | おおむね | ||
素性 | 正規化 値 | 素性 | 正規化 値 |
素性1:の | 0.82 | 素性2:対象語が文頭 | 0.66 |
素性2:ので(直前) | 0.76 | 素性1:案 | 0.65 |
素性1:目安 | 0.68 | 素性31:認める | 0.64 |
素性1:話 | 0.68 | 素性1:範囲 | 0.64 |
素性1:距離 | 0.62 | 素性1:一致 | 0.59 |
「おおよそ」は「の」などの助詞を付属語にし,「目安」「見当」のような名詞が修飾先となることが多く,「おおむね」は「好評」「満足」「妥当」などの単語が後ろに来やすいことがわかった.また,「おおよそ」は「のおおよそ」と言う表現も多かった.修飾先の品詞にも特徴が見られた.「おおよそ」は修飾先が助詞,「おおむね」は修飾先が形容詞,動詞が多くなることがわかった.助詞の例は「が」「は」「を」が特に多かった.「おおむね」が修飾する形容詞は「良好だ」「妥当だ」「適切だ」など,動詞は「認める」などであった.また,「おおよそ」は助詞,名詞が被修飾先としても多く使われていた
また,文献[5]には以下のように書かれている.
「おおよそ」は、全体をざっと見渡して大体の見当をいう.「大凡」とも書く.「おおむね」は、全体の中の主な点を大きくつかむことをいう.概要の意味でも使われる.「概ね」とも書く.
文献[5]と素性分析の結果を比較し同じ結果となったことを以下に示す.「おおよそ」は「目安」「見当」などの大体を表すという点で同じであった.「おおむね」は「案」などの概要を表すことという点で同じであった.
文献に載っておらず,素性分析から新たにわかったことを以下に示す.「おおよそ」は修飾先が助詞,名詞,「おおむね」は形容詞,動詞が多くなることが新たにわかった.
文献に載っているが素性分析からは得られなかったことはなかった.