次へ: 入力データの種類
上へ: 実験
戻る: 実験
目次
実験で順序推定を行う際に用いる2段落対の組には3種類の場合を考慮して学習データとテストデータを作成する.
- 1.
- 記事内の最初の2段落のみの対の順序を推定する場合(以下Case1と表記)
- 2.
- 記事内のあらゆる連接する2段落の対の順序を推定する場合(以下Case2と表記)
- 3.
- 記事内全てから2段落を用いる組み合わせの対の順序を推定する場合(以下Case3と表記)
機械学習に用いる学習用文章には,毎日新聞1992年7月の1ヶ月分を用いる.
各場合での学習データの2段落対の組数を表7.1に示す.
表:
各2段落対に用いる学習データの2段落対の組数(組)
|
Case1 |
Case2 |
Case3 |
学習データ |
3,124 |
15,020 |
80,248 |
本実験では,以下3種類の手法を用い,
- 先行研究[1]のみの素性を用いる提案手法(以下素性拡充前と表記)
- 先行研究の素性に本研究で作成した素性を拡充した提案手法(以下素性拡充後と表記)
- 被験者2名の順序推定の平均(以下人手推定と表記)
2種類の比較実験(実験1,実験2)において
各2段落対での順序推定を各々行う.
- 実験1.
- 素性拡充前と素性拡充後の提案手法と比較手法による順序推定の比較
- 実験2.
- 素性拡充前と素性拡充後の提案手法と比較手法と人手推定の比較
テストデータには,
実験1の場合,毎日新聞1992年8月1日の1日分を用いる.
実験2の場合での,Case1の順序推定を行う場合は毎日新聞1993年6月の1ヶ月分,Case2の順序推定を行う場合は毎日新聞1993年7月の1ヶ月分,Case3の順序推定を行う場合は毎日新聞1993年8月の1ヶ月分を用いる7.1.
各実験に用いたテストデータの組数を表7.2,表7.3に示す.
表:
実験1でのテストデータの2段落対の組数(組)
実験1 |
Case1 |
Case2 |
Case3 |
テストデータ |
412 |
3,146 |
13,040 |
表:
実験2でのテストデータの2段落対の組数(組)
実験2 |
Case1 |
Case2 |
Case3 |
テストデータ |
50 |
50 |
50 |
平成27年3月4日