Next: 提案手法
Up: soturon
Previous: はじめに
目次
文書からの情報抽出による文章作成支援として藤原[1],赤野[2]の研究が挙げられる.
藤原[1]の研究では,Wikipediaの城に関するページを抽出し,
その中から城に関する重要情報をCaboCha[3](固有表現抽出ツール)を用いた固有表現抽出に基づく手法と
ALAGIN[4]の上位下位知識に基づく手法の2手法で抽出する.
2つの手法によって重要情報を抽出したものを表にまとめる.
表に空欄箇所があった場合,情報が欠けている記載欠落箇所と判定し,記載欠落箇所をユーザに知らせて記載の追加を促すことで文章作成支援を行った.
赤野[2]の研究では,藤原[1]の研究で行った重要項目の取り出し技術の改良を目的として,word2vec[5]を用いたクラスタリングに基づく手法でWikipediaから重要情報を抽出し表にまとめた.
藤原[1]と同様に,表に空欄箇所があった場合,情報が欠けている記載欠落箇所と判定し,記載欠落箇所をユーザに知らせて記載の追加を促すことで文章作成支援を行った.
これらの先行研究では表の記載欠落箇所の指摘は行うものの,記載欠落箇所に埋めるべき情報をユーザに提示する手法の検討は行われていない.
そこで本稿では検索エンジンを用いて,記載欠落箇所に埋めるべき情報を取得する手法の研究を行うことで文章修正支援に役立てる.
質問応答システムの精度向上として村田ら[6][7]の研究が挙げられる.
質問応答システムの精度向上を目的に,スコアを減らしながら複数の記事でのスコアを利用する方法を提案した.単純にスコアを加算するだけではシステムの性能が下がる場合があるため,この研究ではスコアの加算の際にスコアを減らしながら加算する手法を用いている.
Webを情報源とする質問応答システムとして北斗ら[8]の研究が挙げられる.
質問文に含まれる「誰」や「どこ」などの疑問詞を手がかりに,人名,地名,組織名,人工名,数字の5種類の回答タイプの分類を行う質問解析と,Webページ上の質問文に対する回答が書かれていそうな部分の抽出を行うための文書検索と,回答候補を固有表現抽出とスコアの加算処理によって抽出する回答選択の3つの手法を組み合わせたシステムを構築した.
論文に記載すべき情報の自動検出による文章作成支援として岡田ら[9]の研究が挙げられる.
論文の研究成果や研究の有効性・必要性といった論文に記載必要な情報を「記載必要項目」として論文内で記載必要項目が欠落しているか否かを自動で検出することで文章作成支援を行った.
root
2017-03-04