next up previous contents
次へ: 原因文のクリーニングが必要 上へ: 再現率低下の原因 戻る: 再現率低下の原因   目次

判断情報知識ベースのデータ不足

5分割クロスバリデーション法を用いて行った 情緒推定実験では,2,635文中,平均1,105文が情緒推定未出力(no_rslt)であっ た.これは, 本知識ベースに頻度1のデータが6,953件(67%)存在していた ことが原因である. よって, 再現率の低下の原因は,本知識ベースのデータ不足であると言える.

再現率を向上させるためには,さらに多くの原因文を収集し, 本知識ベースを充実させる必要がある.本研究では,8種類の接続表現のうち 「ので」のみ使用した.今後は,他の接続表現も使用し,さらに本知識ベースを 充実させる必要がある.



平成23年3月9日