前章で示した構造規則の記述方法に従えば,学習用事例も構造規則と同じ
(1)式の形式で表現されるから,
の各要素は,それ自体,構造規則と見なすこ
とができる.事例からのこのような規則生成では,帰納的推論の方法(長尾
1988)の適用が考えられる.
そこで,式(1)の構造定義部で指定された個の変数に対して,各変数を基底
とする
次のベクトル空間(「特徴空間」とも言う)を考えると,各事例は,特
徴空間上の点に対応するから,構造規則の生成は,この特徴空間内で,同一のク
ラスに属す部分空間を切り出す問題となる.
この種の問題は,特徴空間が線形である場合,クラスタ分析もしくはクラスタ
リングの問題(安西 1989;浅野,江島 1996;Witten & Frank 1999)としても良
く知られており,多変量解析,情報検索などの分野で研究されている.しかし,
式(1)の構造定義部で与えられる各基底はいずれも非線形である ため,計算は
簡単でない.基底がis-a関係で結ばれた木構造となる場合については,
(Haussler 1988)の方法があるが,学習事例が多い場合は,適用困難である.ま
た,事例数の大きい問題への適用を狙った方法として,意味属性の木構造をエン
コーディングした後,既存の計算プログラムC4.5を使用する方法など(アルモア
リムほか 1997)もあるが,学習事例,基底数,(生成される)規則数が共に大
きい場合は,やはり計算困難である.そこで,本論文では,変数の数に着目して
構造規則を次元に分類し,意味属性間の包含関係に着目して規則を生成する方法
を考える.
さて,特徴空間上,同一のクラスに属す点の集合に対して構造規則は定義される.
すなわち,構造規則は,一般に,次空間上の点,もしくは,特定の領域に対応
する.これに対して,
個の変数のうち
個の変数がオールマイティ「
」で表
現された規則は,
次元だけ縮退された規則となり,
次元の空間内のベク
トルで表現されるが,
次元空間で見れば,
次元の立方体に対応する規則
であり,この立方体内に属す事例に適用される.
例えば,三次元の構造規則(,
,
:
)において,
,
,
の何れ
かを「
」で置き換えた規則(例えば,(
,
,
:
))は,三次元空間
上の線に対応する規則となり,2変数を「
」で置き換えた規則(例えば,(
,
,
:
))は,三次元空間上の面に対応する規則となる.
以上から,構造規則をそれが定義される特性空間の次元に従って,一次元規則か
ら次元規則までの
種類に分類する.