next up previous contents
次へ: 冗長度に基づく手法 上へ: 提案手法 戻る: 提案手法   目次

機械学習に基づく手法

機械学習にはサポートベクトルマシンを用いる. 機械学習では先行研究[6]で使用した素性に冗長度を追加して用いる. 使用素性の例は以下の通りである.
○素性番号1(単語)
文内に出現する単語.
○素性番号2(品詞)
文内に出現する単語の品詞.
○素性番号3(3単語連続)
文内に出現する3単語連続. 文内に出現する単語を3単語ごとにつなげた素性である.
○素性番号4(冗長度)
節同様の冗長度を用いた情報.

次に入力文に対して,実際に付与される素性を大まかに示す.

入力文:「マシンの点検を行う。」

素性番号1:付与素性例
名詞+マシン,助詞+の,名詞+点検,...
素性番号2:付与素性例
出現品詞+名詞,出現品詞+助詞,出現品詞+動詞,...
素性番号3:付与素性例
文字列+マシン,文字列+シンの,文字列+ンの点,...
素性番号4:付与素性例
冗長度+ランク1
上記の付与素性の例では,``+''の前の表現は素性の種類を示す記号であり,``+''の後ろの表現はその素性が持つ情報である. また以下のように接頭語を付与している.



平成26年3月16日