next up previous
次へ: (2)文法属性を使用した規則への汎化 上へ: 規則生成の順序と汎化 戻る: 規則生成の順序と汎化

(1)構造規則の生成順序と適用順序

すでに述べた一次元規則から$N$次元規則までの規則では,次元の小さい規則ほど 制約条件が少なく,汎用性が高い.また,そのような規則は高速に適用できるか ら,規則生成においては,一次元規則から順に生成する[*] .このと き,規則生成で使用された学習事例を後の規則生成で再び使用するか否かが問題 となる.

図: 構造規則汎化の方法
\begin{figure}\begin{center}
\epsfile{file=zu3.eps,scale=0.9}
\end{center}\vspace*{-4mm}
\end{figure}

ここで,言語解析では,得られた規則をその生成順に適用することとすると,後 に生成された規則が,それ以前に生成された規則の適用範囲に適用されることは ないから,後に生成された規則が先に適用される規則の適用範囲を含んでいても 何ら問題は発生しない.そこで,規則生成では,図3の例に示すように,生成に 使用した事例は,事例集合から削除し,後の規則生成は,残された事例を対象に 進める.このように,事例の特徴空間から,ある部分的な空間から規則を抽出し た後,その空間に含まれる事例を消去すると,その後の規則生成では,より広い 範囲での汎化が期待できる[*] .以下では,この方法を「逐次型生成 [*] 」と呼ぶ.

以上から,構造規則生成の手順をまとめると,以下の通りとなる.

<構造規則生成の手順>

  1. 事例集合${S_1}$から,事例集合${S_2}$を作成する.${S_2}$は, ${S_1}$の各標本内の変数部分の単語をその単語の属す意味属性番号に置き換えたものである.
  2. 事例集合${S_2}$から,一次元規則の集合${R_1}$を生成し汎化する [*] .そのとき, 規則生成に使用した事例は,${S_2}$集合から削除する.
  3. 上記で残った事例${S_2}$から,二次元規則の集合${R_2}$を生成し,汎化する. そのとき,規則生成に使用した学習事例は,${S_2}$集合から削除する.
  4. 以下同様にして,$N$次元までの規則集合 ${R_i(1\leq i\leq N)}$を生成する.
  5. 以上の結果,残された学習用事例${S_2}$の要素に対して,その元となった事 例標本の集合を${R_e}$とする.(${R_e}$ は,事例そのものである が,同時に構造規則でもある.)

なお,各次元規則の生成と汎化の方法は,次章で述べる.以上で得られる構造規 則の種類は,以下の通りである.

  $\textstyle (1)$ $\displaystyle 「意味属性規則」の集合 \ \ \ \ \ {\sum_{i=1}^N R_i}$ (5)
  $\textstyle (2)$ $\displaystyle 「字面規則」の集合 \ \ \ \ \ \ \ \ \ \ \ \ {R_e}$ (6)



Jin'ichi Murakami 平成13年9月13日