文が読みにくい理由の一つに文が冗長であることが挙げられる[1]. 文の生成や推敲の支援システムの構築には,冗長箇所を修正する技術が必要とされている.
例文「まず初めにマシンの点検を行う。」を考えてみよう. 文中の「まず」と「初め」は同じ意味を含む単語であり冗長性がある. 「点検を行う」は用言性名詞「点検」が「行う」の意味を含むため冗長性がある. ここで冗長箇所を修正すると,「まずマシンを点検する。」という簡潔な文となる. この文は,例文と同じ意味を持ち,かつ,例文より簡潔な文である. 本研究では,同じ意味のより簡潔な文に修正できる文を冗長な文と し研究を進める.
文の改善の研究としては「誤字の修正・適切な語の選択」と「語順の修正・語と語の係り受けの誤りおよび複雑性の修正」と「冗長な表現の改善」が考えられる.このうち「誤字の修正・適切な語の選択」と「語順の修正・語と語の係り受けの誤りおよび複雑性の修正」の研究に関しては既に先行研究が多数ある.「誤字の修正・適切な語の選択」では文献[1,2,3]が,「語順の修正・語と語の係り受けの誤りおよび複雑性の修正」では文献[1,4,5]がある.しかし「冗長な表現の改善」を扱う研究についてはほとんどないため本研究で扱う.
「冗長な表現の改善」には,「1.冗長な文の分析」「2.冗長な文の検出」「3.冗長な文の修正」の3つのプロセスが考えられる. 対象となる冗長な文は大きく, 「一文における冗長な文」と 「冗長な文章(複数の文にまたがる冗長な文)」に分けられる. 都藤らは[6],その手始めとして,「一文における冗長な文」における「冗長な文の分析」と「冗長な文の検出」を行っている. 本研究では,「一文内における冗長な文」における「冗長な文の修正」をするとともに,取り扱うデータを拡大し「冗長な文章」で「冗長な文の分析」と「冗長な文の検出」を行うことを目的とする.
この目的を達成するため,本論文では,以下の研究を行う.
本研究の主な主張点は以下である.