Support Vector Machine

次へ: 素性 上へ: Support Vector Machineへの適用 戻る: Support Vector Machineへの適用目次

Support Vector Machine

サポートベクトルマシン法は，空間を超平面で分割することにより 2つの分類からなるデータを分類する手法である．このとき，2つの分類が正例と負例からなるものとすると，学習データにおける正例と負例のマージン（間隔）を大きくとるほど分類器の誤りが減少するという考えから，このマージンを最大にする超平面を求めそれを用いて分類を行う．一般的に上記の方法の他に，「ソフトマージン」と呼ばれる学習データにおいてマージンの内部領域に少数の事例が含まれてもよいとする手法の拡張や，線形分離が不可能な問題に対応するために，超平面の線形の部分を非線型にする拡張(カーネル関数の導入) がなされたものが用いられる．この拡張された方法は，以下の識別関数を用いて分類することと等価であり，その識別関数の出力値が正か負かによって二つの分類を判別することが可能である．

$\displaystyle f({\bf x})$	$\textstyle =$	$\displaystyle sgn \left( \sum^{l}_{i=1} \alpha_i y_i K({\bf x}_i,{\bf x}) + b \right)$	(2.1)
$\displaystyle b$	$\textstyle =$	$\displaystyle -\frac{max_{i,y_i=-1}b_i + min_{i,y_i=1}b_i}{2}$
$\displaystyle b_i$	$\textstyle =$	$\displaystyle \sum^l_{j=1} \alpha_j y_j K({\bf x}_j,{\bf x}_i)$