next up previous
次へ: 規則生成の順序と汎化 上へ: 規則の次元分類とその発見 戻る: (1)特徴空間と構造規則の次元

(2)構造規則発見の方法

事例集合${S_2}$から構造規則を生成するための基本的な考え方について述べる.

対象とする表現の意味は,その前後の文脈に依存せず,与えられた表現だけで 決定できると仮定[*] すると,対象とする表現とそのクラスが1対1の関係を持つ. すなわち,標本集合${S_0}$と事例集合${S_1}$において,同一の表現構造が異なるクラスに属す要素はない.

しかし,字面を意味属性に置き換えて得られた集合${S_2}$では,構造定義部とク ラス定義部が1対1に対応する場合と,1対1には対応せず,同一の構造に対し て異なる複数のクラスが対応する場合が存在すると考えられる[*] .このうち,前 者は,構造定義部で定義された表現の解釈は一意に決定できることを意味してい るから,このような部分集合から「意味属性規則」が生成できる[*] .すなわち,

  1. 集合${S_2}$の要素を構造定義部の等しい要素毎に分類する.分類さ れたグルー プ内の要素が,いずれも同一のクラスを持つとき,そのグループから一 つの構造規則が生成できる.生成された規則は,該当するグループの要 素数が多いほど,信頼性が高い.
  2. 分類されたグループ内の要素のクラスが一致しないときは,そのグルー プからは構造規則は生成できない.その場合,「意味属性規則」は存在 しないと判断できるから,もとの${S_2}$の要素(字面表記)を構造規則 (「字面規則」と呼ぶ)とする.

このうち,(1)で得られる構造規則は,構造定義に使用された意味属性相互の包 含関係を使用すれば,さらにグループ化することができて,より汎用的な規則の 生成が期待できる.これに対して,(2)で得られた規則は,一般化の困難な表現, すなわち慣用表現に類する表現の規則であると推定されるから,汎化の対象外と なる[*]


Jin'ichi Murakami 平成13年9月13日