文の順序推定に関する研究の多くは文章要約の一環として行われており, 要約前の文章から得られる情報を用いて文の順序推定を行うのが主な手法である[1]. もし要約前の文章から得られる情報を用いずに文の順序推定が可能ならば, 文生成における文の順序推定技術の応用範囲が広がる. 例えば,要約前の文章の情報を用いずに 文の順序推定ができれば,その技術は文章の推敲にも利用できる. そこで,本研究では,要約前の文章の情報を用いない 文の順序推定の問題を扱う.
要約前の文章の情報を用いずに文の順序を推定する研究に関しては, Lapata[2]の提案する確率モデルなどがあるが, 教師あり機械学習により文の順序を推定する研究はなされていない. そこで教師あり機械学習でこの問題を扱うこととした. 本研究では,教師あり機械学習としてサポートベクトルマシン(SVM)を利用する1.1.
本研究では教師あり機械学習とともに多くの情報を利用した 文の順序推定の方法を提案する. 確率モデルは多くの情報を用いることが困難である. それに対して,教師あり機械学習では 多くの素性を設定することで容易に多くの情報を用いることができる. 提案手法は多くの情報を利用するため, 既存の確率モデルよりも高い性能を出すことが期待される.
文の順序推定の研究の手始めとして, 本稿では,シンプルな問題を設定する. 複数の段落をまたがった現象は複雑であると考え, 段落内の情報のみを用いて, 段落内の2文について, そのどちらを先に書くべきかを推定することを 本稿で扱う問題とする1.2.
以下に本研究の主張点をまとめる.