次へ: 冗長な文の修正
上へ: 関連研究
戻る: 知見
目次
要約等の研究から参考とした知見について述べる.
- 大竹ら[7]は新聞の関連複数記事を1つの文書へと要約するための手法を提案している.
各記事の第一段落を用いて,その重複部・冗長部を削除することにより複数の関連記事をどの程度要約できるかを明らかにした.
この研究での要約の手法は,
- 各記事の第一段落を時系列に並べる.
- 推量文を文末表現で特定し削除する.
- 詳細な住所の表現も冗長部として削除する.
- 記事の前提条件等を導入部とし,導入部の名詞と動詞がそれ以前の記事の文に
含まれる場合削除する.
- 頻繁に出現する人名・地名
に関してそれぞれ記事内と記事間における重複を調べ重複している部分は1 つを残し,他は
削除する.
以上の処理で最終的に残った文章が要約文章となる.
この研究は文書要約であるが,本研究の冗長な文の判定基準の作成で参考にした.
- 原口ら[9]は開発関連文書の品質を向上させるために校正基準を定義し文書表現の記述不備を検出した.そこで開発した手法を目視による品質調査と比較を行い検出に要する時間を短縮し,検出性能も高くすることができた.この研究についても,本研究の冗長な表現の判定基準の作成で参考にした.
- 村田らは,誤った日本語文を抽出する技術[2],適切な英語表現に変換する文パターンを抽出する技術[3],語順を推定する技術[4],係り受けの複雑さを計量する技術[5]を構築し誤字の修正・適切な語の選択と語順の修正・語と語の係り受けの誤り及び複雑性の修正を行った.
平成26年3月16日