次へ: 実験結果
上へ: 実験条件
戻る: CASE2:段落内の連接した2文を用いる場合
目次
CASE3は段落内の文の全ての組み合わせを考慮し,2文1組を作成する.
作成した組において,元の新聞記事内での順序を正しい順,その逆順を誤った順として学習データとテストデータを作成する.
テストデータで作成した2つの順序のどちらが正しいかを教師あり機械学習を用いて推定する.
推定結果が実際の新聞記事での順序であるかを確認する.
図
の場合を例にあげる.
文A,B,Cで構成される段落が与えられた場合,段落内の全ての文での組み合わせを考慮し,文の2文1組を考える.
この場合考えられる組は,文Aと文B,文Aと文C,文Bと文Cの3通りである.
それぞれの組において,元の記事での順序を(この場合,文A
文Bの順,文A
文Cの順,文B
文Cの順)を正例,
その逆の順序を(この場合,文B
文Aの順,文C
文Aの順,文C
文Bの順)を負例として学習データを作成する.
使用できる情報は,順序推定を行う2文から得られる情報とそれ以前の文に出現した情報である.
平成25年10月13日