next up previous
次へ: (2)構造規則発見の方法 上へ: 規則の次元分類とその発見 戻る: 規則の次元分類とその発見

(1)特徴空間と構造規則の次元

前章で示した構造規則の記述方法に従えば,学習用事例${S_2}$も構造規則と同じ (1)式の形式で表現されるから,${S_2}$の各要素は,それ自体,構造規則と見なすこ とができる.事例からのこのような規則生成では,帰納的推論の方法(長尾 1988)の適用が考えられる.

そこで,式(1)の構造定義部で指定された$N$個の変数に対して,各変数を基底 とする$N$次のベクトル空間(「特徴空間」とも言う)を考えると,各事例は,特 徴空間上の点に対応するから,構造規則の生成は,この特徴空間内で,同一のク ラスに属す部分空間を切り出す問題となる.

この種の問題は,特徴空間が線形である場合,クラスタ分析もしくはクラスタ リングの問題(安西 1989;浅野,江島 1996;Witten & Frank 1999)としても良 く知られており,多変量解析,情報検索などの分野で研究されている.しかし, 式(1)の構造定義部で与えられる各基底はいずれも非線形である[*] ため,計算は 簡単でない.基底がis-a関係で結ばれた木構造となる場合については, (Haussler 1988)の方法があるが,学習事例が多い場合は,適用困難である.ま た,事例数の大きい問題への適用を狙った方法として,意味属性の木構造をエン コーディングした後,既存の計算プログラムC4.5を使用する方法など(アルモア リムほか 1997)もあるが,学習事例,基底数,(生成される)規則数が共に大 きい場合は,やはり計算困難である.そこで,本論文では,変数の数に着目して 構造規則を次元に分類し,意味属性間の包含関係に着目して規則を生成する方法 を考える.

さて,特徴空間上,同一のクラスに属す点の集合に対して構造規則は定義される. すなわち,構造規則は,一般に,$N$次空間上の点,もしくは,特定の領域に対応 する.これに対して,$N$個の変数のうち$K$個の変数がオールマイティ「$*$」で表 現された規則は,$K$次元だけ縮退された規則となり,$N-K$次元の空間内のベク トルで表現されるが,$N$次元空間で見れば,$N-K$次元の立方体に対応する規則 であり,この立方体内に属す事例に適用される.

例えば,三次元の構造規則(${A_1}$, ${A_2}$, ${A_3}$$C$)において,${A_1}$, ${A_2}$, ${A_3}$の何れ かを「$*$」で置き換えた規則(例えば,($*$${A_2}$, ${A_3}$$C$))は,三次元空間 上の線に対応する規則となり,2変数を「$*$」で置き換えた規則(例えば,($*$${A_2}$$*$$C$))は,三次元空間上の面に対応する規則となる.

以上から,構造規則をそれが定義される特性空間の次元に従って,一次元規則か ら$N$次元規則までの$N$種類に分類する.


Jin'ichi Murakami 平成13年9月13日