前章で示した構造規則の記述方法に従えば,学習用事例も構造規則と同じ (1)式の形式で表現されるから,の各要素は,それ自体,構造規則と見なすこ とができる.事例からのこのような規則生成では,帰納的推論の方法(長尾 1988)の適用が考えられる.
そこで,式(1)の構造定義部で指定された個の変数に対して,各変数を基底 とする次のベクトル空間(「特徴空間」とも言う)を考えると,各事例は,特 徴空間上の点に対応するから,構造規則の生成は,この特徴空間内で,同一のク ラスに属す部分空間を切り出す問題となる.
この種の問題は,特徴空間が線形である場合,クラスタ分析もしくはクラスタ リングの問題(安西 1989;浅野,江島 1996;Witten & Frank 1999)としても良 く知られており,多変量解析,情報検索などの分野で研究されている.しかし, 式(1)の構造定義部で与えられる各基底はいずれも非線形である ため,計算は 簡単でない.基底がis-a関係で結ばれた木構造となる場合については, (Haussler 1988)の方法があるが,学習事例が多い場合は,適用困難である.ま た,事例数の大きい問題への適用を狙った方法として,意味属性の木構造をエン コーディングした後,既存の計算プログラムC4.5を使用する方法など(アルモア リムほか 1997)もあるが,学習事例,基底数,(生成される)規則数が共に大 きい場合は,やはり計算困難である.そこで,本論文では,変数の数に着目して 構造規則を次元に分類し,意味属性間の包含関係に着目して規則を生成する方法 を考える.
さて,特徴空間上,同一のクラスに属す点の集合に対して構造規則は定義される. すなわち,構造規則は,一般に,次空間上の点,もしくは,特定の領域に対応 する.これに対して,個の変数のうち個の変数がオールマイティ「」で表 現された規則は,次元だけ縮退された規則となり,次元の空間内のベク トルで表現されるが,次元空間で見れば,次元の立方体に対応する規則 であり,この立方体内に属す事例に適用される.
例えば,三次元の構造規則(, , :)において,, , の何れ かを「」で置き換えた規則(例えば,(,, :))は,三次元空間 上の線に対応する規則となり,2変数を「」で置き換えた規則(例えば,(, ,:))は,三次元空間上の面に対応する規則となる.
以上から,構造規則をそれが定義される特性空間の次元に従って,一次元規則か
ら次元規則までの種類に分類する.