要約の関連研究

本研究は,大量のテキストデータから単語間の関係を示す文字列を抽出している. この文字列は,大量のテキストデータからの要約とみなすことができるため,本研究は,要約の研究に関連する. 要約の関連研究を以下に示す.

瀧川ら[#!takigawa!#]は,入力文から名詞を抽出し,抽出した各名詞から名詞の共起語を取得している.取得した共起語を連想知識として用いることで,端的な要約を生成する手法を提案した.例として,「良い企業に内定をもらうために面接の練習を毎日行う」という入力文からは,「就職活動」という端的な要約を得ることができている.

西川ら[#!nisikawa!#]は,複数の文書から要約を作成する複数文書要約を,冗長性制約付きナップサック問題として捉えた.この問題に対し,ナップサック問題に基づく要約モデルに,冗長性を削減するための制約を加えることで,複数文書要約モデルを得ている.

森ら[#!mori!#]は,複数の質問の答とその背景知識を一度に概観できる要約を生成する手法を提案している.複数の質問文を入力し,質問応答エンジンと語の出現分布を用いて,文の重要度の計算を行った.その結果,複数の質問文の答を含む要約文書を抽出している.

Liu[#!liu2019fine!#]は,単一文書の要約の手法として抽出型の要約に着目した.抽出型要約のタスクにBERT[#!devlin2018bert!#]を使用するため,BERTSUMなどの様々なモデルを設計し,従来の手法と比較を行った.

Rossielloら[#!rossiello2017centroid!#]はテキストの要約抽出の手法としてセントロイドベースの抽出法を提案した.この手法では,文書の要約を行う際,その文書中の意味のある単語を選択し,出現頻度を基に順位付けを行う.順位が上位の単語のベクトルの合計として重心を求め,重心に近い文を文書中から選択し,要約とした.