Next: 分析結果を使った文章作成支援方式
Up: 考察
Previous: 5段階レベルの分類からの考察
目次
論文の記載必要項目「目的」「問題点」についてレベル4以下の論文を人手でレベル5の論文になるように修正した. その結果, 記載必要項目「目的」であれば26文, 記載必要項目「問題点」であれば16文の合計42文の修正文が獲得できた. また, 獲得できた修正文から, 単語連続頻度調査と階層クラスタリングを用いて記載必要項目「目的」であれば「〜を目的として〜」「〜という問題を解消する〜」という修正パターンが得られ, 記載必要項目「問題点」であれば「〜という問題がある(発生する)」という修正パターンが得られた. この結果から, 記載必要項目「目的」「問題点」について書く場合「目的」「問題点」という単語を使うことが一番内容が理解しやすい書き方であると考えられる. 第4章で, 「目的」「問題」という単語が書かれていない論文を記載必要項目「目的」「問題点」について記載不備がある論文であると判別し自動検出するルールベース手法の有効性を確認した. 今回獲得した修正文・修正パターンの結果は, 記載不備論文の自動検出において, 機械学習手法と比べてルールベース手法のほうが精度が良くなった理由の一つになると考える.
単語連続頻度調査で得られた修正パターン(表5.8)と階層クラスタリングで得られた修正パターン(表5.9)を比較すると, 単語連続頻度調査で得られた記載必要項目「目的」の修正パターンの中には「〜するために〜」があるが, 階層クラスタリングで得られた記載必要項目「目的」の修正パターンの中にはないことが分かる. 「〜するために〜を行う」といった表現は目的を示す文として考えられるので, 単語連続頻度調査での分析のほうが階層クラスタリングでの分析に比べて単純な方法でより良い修正パターンを獲得できると考える. しかし, 階層クラスタリングの図4.18の結果から, 記載必要項目「目的」の修正文の傾向として大きく分けて「〜するために」と「〜を目的として」の2種類だということが視覚的に分かる. 同様に, 図4.19の結果から, 記載必要項目「問題点」の修正文の傾向も「〜という問題がある」「そのような〜」「〜という問題が発生する」「問題点」の4種類だということが視覚的に分かる. このことから階層クラスタリングは修正文全体の傾向から視覚的に修正パターンを獲得するのに適していると考える.
2017-02-24