村田ら[2][3]の研究では,近年,アンケート分析やマーケティングリサーチに利用されているテキストマイニングの高度化を目的とし,半自動で大規模記事群から数値,固有表現情報を取り出して表やグラフを生成するテキストマイニング可視化システムを構築した.この研究では,抽出した情報を表やグラフとして可視化する,という点では本研究と類似しているが,本研究ではさらに文章作成支援を行うという点で違いがある.
樫本ら[4]の研究では,論文のサーベイを効率良く行うために,学術論文からルール及び機械学習であるSVMを用いて,図や表,参考文献欄の書誌情報や脚注などの論文構成要素を抽出する手法を提案した.この研究では論文のサーベイを効率よく行うことを目的としているが,本研究では内容が欠落した文を抽出しユーザに知らせることを目的としている.
中渡瀬ら[5]の研究では,論文アブストラクトの中から特に重要な内容である「主旨」を表現している文を抽出するために,「本論文では」「本研究」などの主旨を誘発するキーワードを手ががりとして,対象となる文を獲得する.その処理で獲得できなかった文は,「主旨」を表現する文のサンプル集合を用意する,という二段階の手法を提案した.二段階目は,一段階目で獲得した文に含まれる述語を抽出して作成した述語リストを使って対象となる文を獲得する.この研究では「文」を抽出しているが,本研究では「文」ではなく対象となる語句を抽出するという違いがある.
村田ら[6][7]の研究では,質問応答システムの精度向上のために,得点を減らしながら複数の記事の得点を利用する新しい方法を提案した.ただ単純に得点を加算するだけではシステムの性能を下げる場合がある,そこでこの研究では単純に加算する際に生じる問題に対処するために,得点の加算の際に得点を減らしながら加算する手法を用いている.質問応答システムとは,与えられた質問に対してその答えを出力するシステムのことである.
以上5つの先行研究を紹介した.どれも情報抽出の研究という点では類似しているが,どれも本研究とは手法が違っていた.さらに多くの先行研究では重要情報の抽出を大きな目的としているが,本研究では情報の欠落した文章を指摘しユーザに知らせることを目的としている点で新規性がある.