next up previous contents
次へ: 目次 上へ: syuu_2_10_3 戻る: syuu_2_10_3   目次

概要

文が読みにくい理由の一つに文が冗長であることが挙げられる[1]. 文の生成や推敲の支援システムの構築には,冗長箇所を修正する技術が必要とされている.

本研究では, 冗長な文を自動修正する方法を提案することを目的とする. 文の改善の研究としては「誤字の修正・適切な語の選択」と「語順の修正・語と語の係り受けの誤りおよび複雑性の修正」と「冗長な表現の改善」が考えられる.このうち「誤字の修正・適切な語の選択」と「語順の修正・語と語の係り受けの誤りおよび複雑性の修正」の研究に関しては既に先行研究が多数ある.「誤字の修正・適切な語の選択」では文献[1,2,3]が,「語順の修正・語と語の係り受けの誤りおよび複雑性の修正」では文献[1,4,5]がある.しかし「冗長な表現の改善」を扱う研究についてはほとんどないため本研究で扱うこととした. 本研究では,冗長な文の修正をするとともに,取り扱うデータの拡大し冗長な文章での検出を行う.

冗長な文を修正する方法として, パターンを用いた手法と機械学習を用いた手法を用いる. 「可能」「という」「すること」の存在が原因となって冗長と なった文を修正する実験を行った. 修正前と修正後の両方の表現を推定する場合,機械学習が関係する手法では,6割の正解率を得た. 修正後の表現のみを推定する場合においても,機械学習が関係する手法で,7割の正解率を得た. 冗長な文章での実験では,次の知見が得られた. 分析により典型的な3種類の分類を獲得でき, また機械学習を用いる手法と,冗長度を用いる手法により冗長な文章を検出した. 機械学習を用いた手法の正解率(0.66)と,冗長度を用いる手法の正解率(0.65)を得た. 冗長度の有用性の確認として1文における冗長な文において,先行研究[6]の機械学習に冗長度を素性に追加したところ性能向上が見られた.



平成26年3月16日