次へ: 謝辞
上へ: G1
戻る: 関連研究
目次
本研究では冗長な文を分析する方法,機械学習を用いて自動的に検出をする方法を提案した.
冗長な文を分析した結果「可能」や「すること」などの表現が入った文は
冗長である可能性が高いことがわかった.
すべての文に対して1個の機械学習を利用して
冗長な文の判定を行う手法で,
0.52の適合率を得てベースライン(すべてを冗長な文と判定する方法)を
上回ったが,F値ではベースラインより劣っていた.
そこで特定の表現ごとに機械学習を行って冗長な文を検出する手法を利用した.
この手法では,「可能」「という」「すること」の表現において0.7から0.8という
比較的高いF値で検出できた.
この結果はベースラインの性能を上回った.
本研究では,「可能」「という」「すること」の表現でしか実験していないが,
同様の処理を行うことでこれら以外の表現についても
冗長な表現の検出が期待できる.
今後は,特定の表現ごとに機械学習する方法を
多数の表現で試すとともに,
多数の特定の表現での冗長な表現の検出により
任意の文でのカバー率,つまり,
任意の文で冗長な表現をどの程度検出できるかを調査したいと考えている.
tsudou
平成24年3月14日