next up previous contents
次へ: 最大エントロピー法(ME) 上へ: 提案手法 戻る: 提案手法   目次


サポートベクトルマシン法(SVM)

サポートベクトルマシン法は, 空間を超平面で分割することにより 2つの分類からなるデータを分類する手法である. このとき,2つの分類が正例と負例からなるものとすると, 学習データにおける正例と負例の間隔(マージン)が 大きいもの (図4.3参照4.1) ほどオープンデータで誤った分類をする可能性が低いと考えられ, このマージンを最大にする超平面を求め それを用いて分類を行なう. 基本的には上記のとおりであるが,通常, 学習データにおいてマージンの内部領域に 少数の事例が含まれてもよいとする手法の拡張や, 超平面の線形の部分を非線型にする拡張(カーネル関数の導入)がなされたものが 用いられる. この拡張された方法は,以下の識別関数を用いて分類することと等価であり, その識別関数の出力値が正か負かによって 二つの分類を判別することができる[17,18].
$\displaystyle f({\bf x})$ $\displaystyle =$ $\displaystyle sgn \left( \sum^{l}_{i=1} \alpha_i y_i K({\bf x}_i,{\bf x}) + b \right)$ (4.1)
$\displaystyle b$ $\displaystyle =$ $\displaystyle -\frac{max_{i,y_i=-1}b_i + min_{i,y_i=1}b_i}{2}$  
$\displaystyle b_i$ $\displaystyle =$ $\displaystyle \sum^l_{j=1} \alpha_j y_j K({\bf x}_j,{\bf x}_i)$  

ただし,$ {\bf x}$ は識別したい事例の文脈(素性の集合)を, $ {\bf x}_{i}$ $ y_i(i=1,...,l, y_i\in\{1,-1\})$ は 学習データの文脈と分類先を意味し,関数 $ sgn$ は,
\begin{displaymath}sgn(x) \, =
\left\{
\begin{array}{l}
1 \ \ \ \ (x \geq 0)\\
-1 \ (otherwise) %\nonumber
\end{array}\right.\end{displaymath}     (4.2)

であり,また,各$ \alpha_i$ は式(4.4)と式(4.5)の制約のもと 式(4.3)の $ L(\alpha )$ を最大にする場合のものである.
$\displaystyle L({\alpha})$ $\displaystyle =$ $\displaystyle \sum^l_{i=1} \alpha_i - \frac{1}{2} \sum^l_{i,j=1} \alpha_i \alpha_j y_i y_j K({\bf x_i},{\bf x_j})$ (4.3)


$\displaystyle 0 \leq \alpha_i \leq C \, \, (i=1,...,l)$     (4.4)


$\displaystyle \sum^l_{i=1} \alpha_i y_i = 0$     (4.5)

また,関数$ K$ はカーネル関数と呼ばれ,様々なものが 用いられるが本論文では以下の多項式のものを用いる.
$\displaystyle K({\bf x},{\bf y})$   $\displaystyle = ({\bf x}\cdot{\bf y} + 1)^d$ (4.6)

$ C,d$ は実験的に設定される定数である. 本論文では$ C$ ,$ d$ はともにすべての実験を通して1に固定した. ここで, $ \alpha_i > 0$ となる $ {\bf x}_i$ は, サポートベクトルと呼ばれ,通常,式(4.1)の和をとっている部分は この事例のみを用いて計算される. つまり,実際の解析には学習データのうちサポートベクトルと 呼ばれる事例のみしか用いられない.

サポートベクトルマシン法は 分類の数が2個のデータを扱うもので,通常これに ペアワイズ手法を組み合わせて用いることで, 分類の数が3個以上のデータを扱うことになる[19].

ペアワイズ手法とは,$ N$ 個の分類を持つデータの場合, 異なる二つの分類先のあらゆるペア$ (N(N-1)/2$ 個)を作り, 各ペアごとにどちらがよいかを2値分類器(ここでは サポートベクトルマシン法4.2)で求め, 最終的に$ N(N-1)/2$ 個の2値分類器の分類先の多数決により, 分類先を求める方法である.

本論文のサポートベクトルマシン法は, 上記のようにサポートベクトルマシン法とペアワイズ手法を 組み合わせることによって実現される.


next up previous contents
次へ: 最大エントロピー法(ME) 上へ: 提案手法 戻る: 提案手法   目次
平成25年3月13日