まず、置き換えテーブルを作成し、そのテーブルにそって、 上記の手法を毎日新聞 95年度の一面記事 1万文に対して 適用し、含有率を計算した。 その結果、置き換えによって、重文・複文に関する表現を効率よく抽出 することができた。 また、どのような置き換えが重文・複文に関する表現を抽出するのに適している かを調べることができた。
大規模なコーパスとして毎日新聞 95年度の一年分160万文に適用し、 重文複文における定型的言い回しを抽出した。 連鎖共起抽出方法、離散共起抽出方法のそれぞれを使って、重文・複 文に関する表現を抽出することができた。 その結果、約9万件の重文・複文に関する表現を抽出することができた。