表4.13に単語組「上」「下」「左」「右」の機械学習の分類結果を示す. 表4.14に単語組「上」「下」「左」「右」の正規化α値に基づいた機械学習が参考にした素性を示す.
データ数 | 再現率 | 適合率 | |
上 | 1000 | 0.80 | 0.82 |
下 | 1000 | 0.77 | 0.77 |
左 | 1000 | 0.62 | 0.62 |
右 | 1000 | 0.62 | 0.60 |
総数 | 4000 | 0.70 | 0.70 |
東西南北と同様,上下左右でも「上」と「下」,「左」と「右」は相対的なものであることから双方に対する正規化 1#1値が高くなっていることが分かる.
各々の頻出単語を見ると,「上」では「上方」など単純に物体の位置の情報だけではなく「事実上」や「憲法上」,「画面上」など「〜において」や「〜に関して」という言い回しや「希望を聞いた上で…」や「前置きした上で…」のように「何かをしたあとで」を意味する言い回しが頻出したことから,「上」は慣用的な表現を得ることができた.
また,「下」も「上」と同様,「水面下」や「憲法下」,「体制下」など「表に現れない様」という言い回しや「編集長の下,…」や「監督の下,…」のように「規則や支配の及ぶところ」を意味する言い回しが頻出したことから文章の生成や使い方に役立つ素性を得ることができた.
「左」と「右」は守備や得点を入れたスポーツ選手の名前や,利き手足,攻撃した箇所,打球の行方,身体の負傷箇所などに多く用いられることがわかった. 例として,左では「打率」,「安打」,「骨折」,右では「守備」,「ドリブル」,「投手」などが挙げられた.
「上」と「下」,「左」と「右」の大きな違いとして,「左」と「右」では「事実上」や「水面下」のように名詞の直後に付与させることで一つの慣用句として用いるという素性が見受けられなかった.以上のことから,「上下左右」のように方向としては一括りにできるものも,「上」,「下」と「左」,「右」では文中での使われ方に大きな差があることを知見として得ることができた.