反復語の文間距離を用いた意味段落の推定

中野らは,語が近接して反復する区間に話題形成ポテンシャルが生じ,それが話題結束力を形成するという話題境界判定モデルを考案した[4].

中野らは,同一語が文をまたがって反復するときに,反復語が出現するすべての文間の組み合わせ,それらを反復セットと呼び話題形成の対象要素とした.反復セットにより,反復区間内の隣接する文と文の間に区間距離に反比例した話題を形成するポテンシャルが生じ,これを話題形成ポテンシャルと呼ぶ.すべての反復セットによる話題形成ポテンシャルを集計したものが隣接する文間の結束力を示すものとして,話題結束力と呼ぶ.話題結束力の高まりは話題の存在を示し,低下した箇所が話題境界となっているので,その位置が意味段落の境界であると推定した.社説記事を連結して,記事境界と段落分割点が一致したときを正解とする境界判定実験を行い,再現率0.678,適合率0.618の精度を得た.