next up previous contents
Next: 今後の課題 Up: おわりに Previous: おわりに

結論

本研究では、原文の段階で重文・複文に的を絞った適切な単語置き換えを 行い、文節を縮退することで、効率よく重文複文に関係する表現を発見した。 また、従来の離散共起表現に加え、連鎖共起共起抽出方法によって抽出した。

まず、置き換えテーブルを作成し、そのテーブルにそって、 上記の手法を毎日新聞 95年度の一面記事 1万文に対して 適用し、含有率を計算した。 その結果、置き換えによって、重文・複文に関する表現を効率よく抽出 することができた。 また、どのような置き換えが重文・複文に関する表現を抽出するのに適している かを調べることができた。

大規模なコーパスとして毎日新聞 95年度の一年分160万文に適用し、 重文複文における定型的言い回しを抽出した。 連鎖共起抽出方法、離散共起抽出方法のそれぞれを使って、重文・複 文に関する表現を抽出することができた。 その結果、約9万件の重文・複文に関する表現を抽出することができた。




2000-04-09