next up previous contents
次へ: 精度,再現率の計算 上へ: 情緒推定実験 戻る: 実験方法   目次

正解データ作成

テスト文にはブログ文コーパスを用いる.このブログ文コーパスには, $SO\mathchar \lq -score$算出に用いたコーパスとは別のブログ文データ3,000文を用いた.まず,1文につき1情緒タグを人手で付与する.自動で情緒推定した際にはこの情緒タグと比較する.次に,正解情緒タグを付与したコーパスから以下の条件に合う文を抽出する.抽出した結果,270文をテスト文として得た.
(1)
結合価パターンにマッチする文
(2)
否定語を含まない文
(3)
動詞の時制が過去または現在である文
(4)
極性の反転として扱われる接続表現を含まない文

また,条件に合わなかった文の例を以下に示す

(1)
結合価パターンにマッチしない例
・「確か2年ぶりの晴山ゴルフ場。」
 →用言を含まないため,結合価パターンにマッチせず,条件を満たさない
(2)
否定語を含む例
・「お膳の料理それぞれに箸を付けてみるもどれも口に合わない。」
 →最後の「合う」が否定語になっているため,条件を満たさない
(3)
動詞の時制が過去または現在でない例
・「そのうち晴れるでしょう。」
 →「でしょう」により言い切りの形になっていないので,条件を満たさない
(4)
極性の反転として扱われる接続表現を含む例
・「軽井沢、日差しは強かったけれど日陰に入ると涼しい。」
 →極性の反転として扱われる接続表現「けれど」を含むため,条件を満たさない



Sho Takemoto 平成24年3月13日