next up previous contents
次へ: 問題設定 上へ: honron_1 戻る: はじめに   目次

関連研究

関連研究には以下のものがある.

Lapata[2]は確率モデルによる文の並べ替えを提案している. 1文目に1文目の単語がある場合に2文目に2文目の単語がくる確率を求め, その総積から1文目がある場合の2文目の生起確率を算出し, その確率が最大となる文の並びを構築するものである.

大田ら[3]は確率モデルに加えて統計情報を利用して. 文の連接しやすさと文の連接しにくさを求めて文の順序を推定する手法を提案した. 文の連接のしやすさは,連続する2文間における単語の連接確率から求める. 文の連接しにくさは,1文章における2単語の共起情報と連続する2文における2単語の共起情報の差から求める.

岡崎ら[1]は複数の記事から抜き出された文の並べ替えを行っている. 要約前の文章から得られる情報を用いた手法であり, 要約前の文章の情報を用いない本研究とは大きく異なる手法である. 順序を推定する対象となっている文が,要約前の文書でどのような環境にあるかに着目した 手法である. 複数の記事から抜き出された文を話題毎にグループ分けし, グループ毎に記事が記載された順に文を並べる. その後,ある文1の前提知識と考えられる文が,その文1の前に 来るように,文の並び順を改善する. 文1の要約前文書での文1の先行文と類似する文を, 文1の前提知識と考えられる文とする.

また,文生成に関連して教師あり機械学習により語順を推定する研究に内元ら[4]の研究がある. 我々の研究が文の順序の推定に教師あり機械学習を利用するのに対して, 内元らは語順の推定に教師あり機械学習を利用する. 内元らは,教師あり機械学習として最大エントロピー法を用いる. 内元らは,文節の係り受け情報をもとに,語順を推定する. 正しい語順はコーパス内での語順である. このため,語順に関わる学習データはコーパスから自動で構築でき, 人手で学習データを作成する必要がない. 学習データを人手で作成する必要がないことは,我々の研究でも同様である. 我々の研究では,正しい文の順序はコーパス内での文の順序であるので, 文の順序に関わる学習データをコーパスから自動で構築できる.



平成25年10月13日