next up previous contents
次へ: 「うたい文句」と「キャッチフレーズ 上へ: 再現率低の例 戻る: 再現率低の例   目次

「上期」と「上半期」

(正解例1)
八八年までは毎年十件に満たなかったが、八九年は二十四件に急増、九〇年は十九件、今年は上半期だけで十一件にのぼる。
(正解例2)
湾岸ショックの逆風が弱まり、今年度上期をボトムに下期から上向くとみているからだ。
(誤り例1)
大手証券四社の九一年度上半期(四 九月)の債券売買益で、大和証券が業界トップの野村証券を抜き、半期ベースながら初めて首位に立ったことが十一日、明らかになった。
(誤り例2)
都銀の年度上期中の預金残高の減少は、全銀協が調査を開始した一九五四年以来初めて。


表: 機械学習の結果(再現率低の例:「上期」と「上半期」)
  再現率 適合率 総数
上期 0.45 0.56 60
上半期 0.83 0.75 124


表: 機械学習が参考にした素性(再現率低の例:「上期」と「上半期」)
上期 上半期
素性 正規化α値 素性 正規化α値
素性1:下期 0.77 素性1:市場 0.66
素性1:決算 0.70 素性1:生産 0.62
素性1:調査 0.64 素性1:今年 0.62

再現率低の例として,「上期」と「上半期」という対がある.この対の語は,EDR日本語単語辞書で概念識別子に0ea538のみが与えられており,EDR概念辞書によるとこの識別子は「会計年度などの1年を2期にわけた前半の6ヶ月」を意味する.

6.10の機械学習が参考にした素性を見ると,お互いの素性に経済や金融と関連のある「決算」や「市場」が素性として現れており,どちらも経済や金融のことについて記述された文章で使用されることがわかる.例文を見ても,経済や金融に関する記事がかなり多く,人間による判定も難しいと考えられる.唯一判定の基準になるものとして,「上期」を含む文中には「下期」が対となって記述されている文章があるということがわかり,「下期」が文中にない場合,どちらを使用してもよいと推測できる.これにより,この同義語対は特定の場合を除き,使い分けが必要でないと言える.



平成25年2月19日