next up previous contents
Next: 離散型共起表現 Up: N-gram統計処理による共起表現 Previous: N-gram統計処理による共起表現

連鎖型共起表現

原文データに現れる文字列をすべて抽出する方法である。図1のα のように原文中から一度抽出された文字列の内部に含まれる部分文字列を抽出 するか否かによって次の3つの抑制法がある。部分文字列とは、図中のβのよ うな文字列を指し、γのような文字列は含まない。 (実験では、2文字以上、頻度2以上の文字列を抽出対象とした)


  
図 1: 連鎖型共起表現の例
1#1


  
図 2: 連鎖型弱抑制共起表現の例
2#2



MatobaKazuyuki 平成11年4月15日