次へ: 問題設定
上へ: 関連研究
戻る: 用いる文章が本研究と異なる関連研究
目次
伊藤ら[1]は新聞記事から段落の順序推定のために,
多数の素性を用いた機械学習に基づく研究を行った.
林ら同様,新聞記事から2段落1組で抜き出し,
その2段落対から正例の段落と負例の段落対の問題を作成し,
機械学習を用いて,その2段落対の問題が正しい順序かどうかを
判定して段落の順序を推定するというものである.
実験では,記事内最初の2段落のみを用いる場合,
記事内全ての連接した2段落を用いる場合の2種類を考慮し順序推定を行った.
また,文の順序推定と段落の順序推定の比較を行い,
文と段落の違いを考察し,扱う情報が多いほど推定しやすくなると検討した.
この研究に対して,
本論文では,入力の種類として
林ら同様[3]記事内全てから2段落対の組み合わせから順序を推定する場合も
考慮して学習データ,テストデータを作成している.
また,段落間の隣接する細かな情報が段落の順序推定に有用であると仮定し,
段落間の最後の文と最初の文に着目したものや
段落内の単語の出現位置により段落間が似通う傾向から,
単語の出現位置を用いて段落間の単語の共起数を求めたものを
素性として組み込んでいるという違いがある.
本研究では,伊藤ら[1]の用いた素性を比較として実験を行うこととする.
平成27年3月4日