ただし,13#13
は識別したい事例の文脈(素性の集合)を,
14#14
と
15#15
は
学習データの文脈と分類先を意味し,関数 16#16
は,
であり,また,各22#22
は式(3.4)と式(3.5)の制約のもと
式(3.3)の
23#23
を最大にする場合のものである.
また,関数28#28
はカーネル関数と呼ばれ,様々なものが
用いられるが本論文では式(3.6)の多項式のものを用いる.
31#31 は実験的に設定される定数である. 本論文ではすべての実験を通して32#32 ,33#33 はそれぞれ1に固定した. ここで, 34#34 となる 35#35 は, サポートベクトルと呼ばれ,通常,式(3.1)の和をとっている部分は この事例のみを用いて計算される. つまり,実際の解析には学習データのうちサポートベクトルと 呼ばれる事例のみしか用いられない.
サポートベクトルマシン法は2値分類器であるため,分類が3個以上のデータを扱う際ペアワイズ手法を組み合わせ利用している[8]. ペアワイズ手法とは,N個の分類を持つデータの場合,異なる二つの分類先のあらゆるペア(N(N-1)/2 個)を作り,各ペアごとにどちらが良いかを2値分類で求め,最終的にN(N-1)/2個 の2値分類の分類先の多数決により,分類先を求める方法である. 本研究では2値分類しか用いないため,ペアワイズ手法等を用いない.