next up previous contents
次へ: 2.記事内のあらゆる連接する2段落を用いる場合 上へ: 実験条件 戻る: 実験条件   目次

1.記事内の最初の2段落のみを用いる場合

先頭2段落対の場合では記事内の最初の2段落のみの対を用いて,2段落1組を作成する. 作成した組において, 作成に用いた記事での元の順序(正順)と その逆順を学習データ,テストデータそれぞれ作成する. 学習データには段落対に用いた順序をそれぞれの段落対に付与し, テストデータもまた学習データ同様各段落対に順序をそれぞれの段落対に付与するが, テストデータの場合は教師あり機械学習からの出力による推定結果との正誤の際に用いる.

先頭2段落対のみを用いるため,6章で挙げた比較手法は用いることができない. また,先頭2段落対であり,推定する2段落以前の段落が存在しないので, 推定する2段落以前の情報を用いる素性(素性a12からa21まで)も用いることができない.

図: 先頭2段落対
\includegraphics[width=15cm]{sento1.eps}

7.1の場合を例に挙げると, 変数AからCは段落であり, (A,B,C)で1記事とし, 順序は上から順になるとする時, 抽出される先頭2段落対は記事内の初めの2段落の対であるため, (A&B)になる.抽出された2段落対(:A&B)から正順(:A→B)と逆順(:B→A)とそれぞれ入出力データとして 学習データを作成する.また先頭2段落対を用いる場合なので,使用可能な段落は(A,B)となる.



平成25年2月12日