next up previous
次へ: 規則の次元分類とその発見 上へ: 構造規則生成の基本的な考え方 戻る: 構造規則生成の基本的な考え方

標本の収集と学習用事例の作成

以下では,コーパスなどの原文から抽出した表現の文字列とそれに対する解釈 (クラス)からなるペアを「標本」,その集合を「標本集合」と呼び${S_0}$で表す. また,標本を式(1)の形式の書き換えたものを「事例」,その集合を「事例集合」 と呼び,${S_1}$で表す.

例として,「$AのBのC$」の形の名詞句に対する係り受け規則の場合の例を以下 に示す.

    $\displaystyle 名詞句の標本集合{S_0}:私の母の友達(私\rightarrow 母)$  
    $\displaystyle 名詞句の事例集合{S_1}:(私,母,友達:{B})$ (3)
    $\displaystyle 但し,{B}は,名詞A(「私」)が名詞B(「母」)に係ることを示す$  

ここで,集合${S_1}$の中のすべての変数の値(字面)を対応する意味属性で置き換え て得られた事例集合を${S_2}$とする.上記の名詞句の事例では,${S_2}$ の要素として,

    $\displaystyle 名詞句の事例集合{S_2}:(\char93 8「自称」,\char93 80「母」,\char93 125「友人」:B)$ (4)
    $\displaystyle 但し,\char93 {n}は,意味属性番号,「」内は,意味属性名を表す.$  

が得られる.以下では,簡単のため,これを, $(\char93 8,\char93 80,\char93 125:B)$または, $(8,80,125:B)$のように記す.

Jin'ichi Murakami 平成13年1月17日