標本の収集と学習用事例の作成

次へ: 規則の次元分類とその発見 上へ: 構造規則生成の基本的な考え方 戻る: 構造規則生成の基本的な考え方

以下では，コーパスなどの原文から抽出した表現の文字列とそれに対する解釈 (クラス)からなるペアを「標本」，その集合を「標本集合」と呼び ${S_0}$ で表す．また，標本を式(1)の形式の書き換えたものを「事例」，その集合を「事例集合」と呼び， ${S_1}$ で表す．

例として，「」の形の名詞句に対する係り受け規則の場合の例を以下に示す．

		$\displaystyle 名詞句の標本集合{S_0}:私の母の友達(私\rightarrow 母)$
		$\displaystyle 名詞句の事例集合{S_1}:(私，母，友達：{B})$	(3)
		$\displaystyle 但し，{B}は，名詞A(「私」)が名詞B(「母」)に係ることを示す$

ここで，集合 ${S_1}$ の中のすべての変数の値(字面)を対応する意味属性で置き換えて得られた事例集合を ${S_2}$ とする．上記の名詞句の事例では， ${S_2}$ の要素として，

		$\displaystyle 名詞句の事例集合{S_2}:(\char93 8「自称」，\char93 80「母」，\char93 125「友人」:B)$	(4)
		$\displaystyle 但し，\char93 {n}は，意味属性番号，「」内は，意味属性名を表す．$

が得られる．以下では，簡単のため，これを， $(\char93 8，\char93 80，\char93 125：B)$ または，

のように記す．

Jin'ichi Murakami 平成13年1月17日