next up previous contents
Next: 実験結果と考察 Up: 実験結果と考察 Previous: 実験結果と考察

実験方法

対象とする原文データを毎日新聞 95年度の一面記事 1万文とし、図 4の手順で実験を行なった。


  
図 4: 実験手順
12#12

4中の太枠の処理は、本研究で提案し、プログラムを作成した処 理である。また、図中の『後処理』とは、単語単位の構成をしていない断片的 な表現を削除する処理であり、プログラムを作成し不要な表現の削除をした。

連鎖共起表現抽出においては、弱抑制型で抽出をした。これは、まとまりのあ る表現のみを抽出するためである。無抑制では、まとまりのない断片的な表現 が多数抽出され、強抑制では、部分文字列が一切抽出できないという問題があ るため、弱抑制型連鎖共起表現抽出を使用した。

離散共起表現抽出においては、強抑制型で抽出をした。これは、定型的な言い 回しのみを抽出するためである。無抑制、弱抑制では、あまりに表現の種類が 膨大になり言い回しではない表現までも抽出し、定型的な言い回しの抽出に向 かないため、強抑制型離散共起表現抽出を使用した。



MatobaKazuyuki 平成11年4月15日