Next: 関連研究
Up: soturon
Previous: 図目次
目次
文章を作成する際に内容が欠落してしまうことがある.情報の欠落した文章はとても読み難いものである.そこで文書から重要情報の欠落を抽出しユーザに指摘する技術が求められている.
本研究では,城に関する重要情報をWikipediaから抽出し,抽出した情報をもとに文章の欠落箇所を抽出し文章作成支援をすることを目的とする.多くの記事で共通して現れる項目を重要項目として,それに関わる情報を取り出して表1.1のような形に整理する.表において空欄になっている箇所は,Wikipedia内で情報が欠けておりその情報を埋めるように文章を書くとよく,そのように文章作成支援をする.またその有効性を確認するための実験も行う.
以下,第2章で関連研究の紹介をする.第3章ではWikipediaからの重要情報抽出の手法と文章作成支援の手法を提案する.第4章では本研究における実験環境を説明する.第5章で本研究の重要情報抽出の実験結果と,文章作成支援の性能の評価,また比較手法との性能の差を報告する.第6章で今後の課題について述べる.最後に第7章で本稿をまとめる.
表 1.1:
城の重要情報の表の例
城名 |
構築年 |
別名 |
構築者 |
... |
大阪城 |
1583年 |
錦城 |
豊臣秀吉 |
... |
姫路城 |
1346年 |
白鷺城 |
赤松貞範 |
... |
熊本城 |
1600年 |
銀杏城 |
加藤清正 |
... |
名古屋城 |
1612年 |
金鯱城 |
徳川家康 |
... |
... |
... |
... |
... |
... |
本研究の特徴を,重要情報の抽出と文章作成支援の二つに分けて以下に整理する.
- 重要情報の抽出
- 重要情報の抽出には固有表現抽出に基づく手法と上位下位知識に基づく手法を用いる.
- 抽出した重要情報を表の形に可視化する.
- 固有表現抽出に基づく手法では0.6から0.8の正解率で重要情報の抽出ができた.上位下位知識に基づく手法では,「地名」を除く項目で約8割の正解率であった.
- 文章作成支援
- 重要情報の抽出のみならず文章作成支援も行えるという新規性がある.
- 文章作成支援の性能は固有表現抽出に基づく手法では0.53のF値であり,上位下位知識に基づく手法では0.85のF値であった.
- 提案手法と比較手法とを比較した結果,固有表現抽出に基づく手法,上位下位知識に基づく手法ともに比較手法より性能が良かった.
OkadaTakuma
2015-03-10