うたい文句 | キャッチフレーズ | ||
素性 | 正規化α値 | 素性 | 正規化α値 |
素性1:日 | 0.64 | デフォルト素性 | 0.69 |
素性1:の | 0.61 | 素性2:」 | 0.62 |
素性1:建設 | 0.59 | 素性1:者 | 0.61 |
再現率低の例として,「うたい文句」と「キャッチフレーズ」という対がある.この対の語は,EDR日本語単語辞書で概念識別子に0ec55cのみが与えられており,EDR概念辞書によるとこの識別子は「短かい宣伝文句」を意味する.
表6.12から,機械学習が「キャッチフレーズ」と推定するのに参考にした素性として「デフォルト素性や『素性2:」』などがある.まずデフォルト素性が「キャッチフレーズ」と推定するのに有効であると判断された理由としては,一般に「うたい文句」よりも「キャッチフレーズ」がよく使用されているからであると推定できる.また『素性2:」』は,正解例2や誤り例2のように,キャッチフレーズの具体的な内容を先に述べてから「キャッチフレーズ」という単語が使用される傾向にあることを示している.この同義語対にはこのような傾向があるということがわかったが,表6.12にある他の素性を見ても,特定の分野の記事ではどちらの語を使用するというような特徴のある素性はなく,全体的な使い分けの必要は少ないと考えられる.