次へ: 最大エントロピー法(ME)
上へ: 提案手法
戻る: 提案手法
目次
サポートベクトルマシン法(SVM)
サポートベクトルマシン法は,
空間を超平面で分割することにより
2つの分類からなるデータを分類する手法である.
このとき,2つの分類が正例と負例からなるものとすると,
学習データにおける正例と負例の間隔(マージン)が
大きいもの
(図4.3参照4.1)
ほどオープンデータで誤った分類をする可能性が低いと考えられ,
このマージンを最大にする超平面を求め
それを用いて分類を行なう.
基本的には上記のとおりであるが,通常,
学習データにおいてマージンの内部領域に
少数の事例が含まれてもよいとする手法の拡張や,
超平面の線形の部分を非線型にする拡張(カーネル関数の導入)がなされたものが
用いられる.
この拡張された方法は,以下の識別関数を用いて分類することと等価であり,
その識別関数の出力値が正か負かによって
二つの分類を判別することができる[17,18].
ただし,
は識別したい事例の文脈(素性の集合)を,
と
は
学習データの文脈と分類先を意味し,関数
は,
|
|
|
(4.2) |
であり,また,各
は式(4.4)と式(4.5)の制約のもと
式(4.3)の
を最大にする場合のものである.
|
|
|
(4.4) |
|
|
|
(4.5) |
また,関数
はカーネル関数と呼ばれ,様々なものが
用いられるが本論文では以下の多項式のものを用いる.
|
|
|
(4.6) |
は実験的に設定される定数である.
本論文では
,
はともにすべての実験を通して1に固定した.
ここで,
となる
は,
サポートベクトルと呼ばれ,通常,式(4.1)の和をとっている部分は
この事例のみを用いて計算される.
つまり,実際の解析には学習データのうちサポートベクトルと
呼ばれる事例のみしか用いられない.
サポートベクトルマシン法は
分類の数が2個のデータを扱うもので,通常これに
ペアワイズ手法を組み合わせて用いることで,
分類の数が3個以上のデータを扱うことになる[19].
ペアワイズ手法とは,
個の分類を持つデータの場合,
異なる二つの分類先のあらゆるペア
個)を作り,
各ペアごとにどちらがよいかを2値分類器(ここでは
サポートベクトルマシン法4.2)で求め,
最終的に
個の2値分類器の分類先の多数決により,
分類先を求める方法である.
本論文のサポートベクトルマシン法は,
上記のようにサポートベクトルマシン法とペアワイズ手法を
組み合わせることによって実現される.
次へ: 最大エントロピー法(ME)
上へ: 提案手法
戻る: 提案手法
目次
平成25年3月13日