上期 | 上半期 | ||
素性 | 正規化α値 | 素性 | 正規化α値 |
素性1:下期 | 0.77 | 素性1:市場 | 0.66 |
素性1:決算 | 0.70 | 素性1:生産 | 0.62 |
素性1:調査 | 0.64 | 素性1:今年 | 0.62 |
再現率低の例として,「上期」と「上半期」という対がある.この対の語は,EDR日本語単語辞書で概念識別子に0ea538のみが与えられており,EDR概念辞書によるとこの識別子は「会計年度などの1年を2期にわけた前半の6ヶ月」を意味する.
表6.10の機械学習が参考にした素性を見ると,お互いの素性に経済や金融と関連のある「決算」や「市場」が素性として現れており,どちらも経済や金融のことについて記述された文章で使用されることがわかる.例文を見ても,経済や金融に関する記事がかなり多く,人間による判定も難しいと考えられる.唯一判定の基準になるものとして,「上期」を含む文中には「下期」が対となって記述されている文章があるということがわかり,「下期」が文中にない場合,どちらを使用してもよいと推測できる.これにより,この同義語対は特定の場合を除き,使い分けが必要でないと言える.