next up previous contents
Next: 謝辞 Up: soturon Previous: スコアを利用して表の作成   目次

おわりに

本研究では,文章の修正支援を行うことを目的に,Wikipediaの文書から重要情報を抽出し,その結果から書き漏れのある文章の検出と,検索エンジンを利用して書き漏れのある文章を修正するための情報の提示を行った.

表の全ての箇所に対して検索エンジンを用いた情報抽出の実験では,固有表現抽出に基づく手法と上位下位知識に基づく手法とクラスタリングに基づく手法の3手法による情報抽出の実験の,情報抽出の性能を5位正解率で求めたところ,すべての重要項目での正解率が0.69の性能で検出できた. 5位正解率で評価する理由として,表に出力した5個の単語をユーザに見せただけではどれが正解かわからないが,5個の単語を取り出した記事も見せることによってどれが正解かわかるようになり,ユーザも単語を5個見せられても困らないので文章の修正支援に役立つ. 5個の中に正解があれば役に立つため,5位正解率によって評価を行った. また5位正解率ならば1位正解率で精度が低くても,1位正解率よりも高い精度を出すことができる.

表の記載欠落箇所のみに対して検索エンジンを用いた情報抽出の実験では,固有表現抽出に基づく手法と上位下位知識に基づく手法とクラスタリングに基づく手法の3手法それぞれに対して表の記載欠落箇所のみでの正解率を求めた結果,5位正解率の値は,固有表現抽出に基づく手法が0.45,上位下位知識に基づく手法が0.45,クラスタリングに基づく手法が0.44であった.

今後の課題として,城名以外での実験を行う予定である. 城データ以外でも適切に情報抽出ができ,文章修正支援に役立てられるかを確かめる必要があると考えている. また,情報抽出の正解率向上のために記事頻度以外のパラメータを足し込んで評価を行うことで,より良い正解率になると考えている.



root 2017-03-04