next up previous contents
次へ: 関連研究 上へ: syuu_2_10_3 戻る: 図一覧   目次

はじめに

文が読みにくい理由の一つに文が冗長であることが挙げられる[1]. 文の生成や推敲の支援システムの構築には,冗長箇所を修正する技術が必要とされている.

例文「まず初めにマシンの点検を行う。」を考えてみよう. 文中の「まず」と「初め」は同じ意味を含む単語であり冗長性がある. 「点検を行う」は用言性名詞「点検」が「行う」の意味を含むため冗長性がある. ここで冗長箇所を修正すると,「まずマシンを点検する。」という簡潔な文となる. この文は,例文と同じ意味を持ち,かつ,例文より簡潔な文である. 本研究では,同じ意味のより簡潔な文に修正できる文を冗長な文と し研究を進める.

文の改善の研究としては「誤字の修正・適切な語の選択」と「語順の修正・語と語の係り受けの誤りおよび複雑性の修正」と「冗長な表現の改善」が考えられる.このうち「誤字の修正・適切な語の選択」と「語順の修正・語と語の係り受けの誤りおよび複雑性の修正」の研究に関しては既に先行研究が多数ある.「誤字の修正・適切な語の選択」では文献[1,2,3]が,「語順の修正・語と語の係り受けの誤りおよび複雑性の修正」では文献[1,4,5]がある.しかし「冗長な表現の改善」を扱う研究についてはほとんどないため本研究で扱う.

「冗長な表現の改善」には,「1.冗長な文の分析」「2.冗長な文の検出」「3.冗長な文の修正」の3つのプロセスが考えられる. 対象となる冗長な文は大きく, 「一文における冗長な文」と 「冗長な文章(複数の文にまたがる冗長な文)」に分けられる. 都藤らは[6],その手始めとして,「一文における冗長な文」における「冗長な文の分析」と「冗長な文の検出」を行っている. 本研究では,「一文内における冗長な文」における「冗長な文の修正」をするとともに,取り扱うデータを拡大し「冗長な文章」で「冗長な文の分析」と「冗長な文の検出」を行うことを目的とする.

この目的を達成するため,本論文では,以下の研究を行う.

  1. 冗長な文の修正を行う(第4章).冗長性の高いとされる「可能」「という」「すること」の表現が入った文を対象として, 表現ごとに修正を行う.冗長な文とその修正文の対を照合し,修正用の文パターンや規則を取得する. これら文パターンや規則を利用して,冗長な文の修正案を提示する技術を構築する.

  2. 検出するデータ規模を冗長な文章(複数文に渡る文)に拡大し研究する(第5章). 冗長な文章をウェブ上から収集,作例し修正の際と同様にパターンや規則の獲得をする.それらを利用し. 文章の冗長性を判定する技術を構築する.

  3. 本研究で提案する冗長度の有用性を確認する(第6章).先行研究[6]のデータセットを用い,1文における冗長な文に役立つかを実験する.先行研究[6]で1文における冗長な文の検出を行っていたが, 冗長度は利用していなかった.

本研究の主な主張点は以下である.



平成26年3月16日