次へ: CASE2:段落内の連接した2文を用いる場合
上へ: 実験条件
戻る: 実験条件
目次
CASE1は段落内の最初の2文のみを用いて,2文1組を作成する.
作成した組において,元の新聞記事内での順序を正しい順,その逆順を誤った順として学習データとテストデータを作成する.
テストデータで作成した2つの順序のどちらが正しいかを教師あり機械学習を用いて推定する.
推定結果が実際の新聞記事での順序であるかを確認する.
CASE1では,段落内において直前の文が存在しないため,素性f10からf13は存在しない.
図の場合を例にあげる.
文A,B,Cで構成される段落が与えられた場合,この段落の最初の2文,文Aと文Bの2文1組を作成する.
元の記事での順序を(この場合文A
文Bの順)を正例,
その逆順(この場合文B
文Aの順)を負例として学習データを作成する.
この時使用できる情報は,順序推定を行う2文から得られる情報である.
テストデータも同様に作成するが,作成した文の順が正例か負例であるか,という情報は
機械学習の出力が正しいかを評価する際に用いる.
平成25年10月13日