次へ: 冗長度に基づく手法
上へ: 提案手法
戻る: 提案手法
目次
機械学習にはサポートベクトルマシンを用いる.
機械学習では先行研究[6]で使用した素性に冗長度を追加して用いる.
使用素性の例は以下の通りである.
- ○素性番号1(単語)
- 文内に出現する単語.
- ○素性番号2(品詞)
- 文内に出現する単語の品詞.
- ○素性番号3(3単語連続)
- 文内に出現する3単語連続.
文内に出現する単語を3単語ごとにつなげた素性である.
- ○素性番号4(冗長度)
- 節同様の冗長度を用いた情報.
次に入力文に対して,実際に付与される素性を大まかに示す.
入力文:「マシンの点検を行う。」
- 素性番号1:付与素性例
- 名詞+マシン,助詞+の,名詞+点検,...
- 素性番号2:付与素性例
- 出現品詞+名詞,出現品詞+助詞,出現品詞+動詞,...
- 素性番号3:付与素性例
- 文字列+マシン,文字列+シンの,文字列+ンの点,...
- 素性番号4:付与素性例
- 冗長度+ランク1
上記の付与素性の例では,``+''の前の表現は素性の種類を示す記号であり,``+''の後ろの表現はその素性が持つ情報である.
また以下のように接頭語を付与している.
- 単語素性はその単語の品詞が接頭語に付与される(例「名詞+マシン」)
- 品詞素性は接頭語に「出現品詞」が付与される(例「出現品詞+名詞」)
- 3文字連続素性は接頭語に「文字列」が付与される(例「文字列+シンの」)
- 冗長度素性は接頭語に「冗長度」が付与される(例「冗長度+ランク1」)
平成26年3月16日