next up previous contents
次へ: f1:文内で出現する単語とその品詞 上へ: 提案手法 戻る: データ作成   目次


用いる素性

機械学習で用いられる個々の情報のことは素性と呼ばれる. 教師あり機械学習法ではこの素性の設定が重要になる. 本研究で用いた素性を表[*]に示す. ただし,素性が2文のうちの1文目と2文目のどちらで出現したかを区別する. 1文目の素性ならば「L」,2文目の素性ならば「R」という接頭語を 素性に付与して区別する. 単語や品詞の取得にはChaSen[6]を用いる. 各素性の詳細な説明を次ページより行う.

表: 素性
素性 説明
f1 文内で出現する単語とその品詞
f2 文内で出現する単語の品詞
f3 文の主語省略の有無
f4 文が体言止めで終わっているかいなか
f5 文内で最初に出現した助詞「は」で文を区切り,その前部で出現した単語とその品詞
f6 文内で最初に出現した助詞「は」で文を区切り,その後部で出現した単語とその品詞
f7 1文目と2文目で使用されている助詞の対
f8 1文目と2文目の単語の共起数
f9 1文目においてのf6と2文目においてのf5が一致した度合い
f10 同じ段落内で,文の順序を判定する2文以前の文に出現する単語とその品詞
f11 同じ段落内で,文の順序を判定する2文の直前の文が体言止めで終わっているかいなか
f12 同じ段落内で,文の順序を判定する2文の直前の文の主語が省略されているかいなか
f13 同じ段落内で,文の順序を判定する2文の直前の文との自立語が一致した度合い



Subsections

平成25年10月13日