まず,小説100冊(新潮文庫)を対象に,形態素解析プログラムALT-JAWS (NTT 1996)を使用して「の型名詞句」を抽出する.そのうちの1万件について,人手 によって係り先を決定し,名詞句の事例集合を作成する.次に,「日本語意 味属性体系」(池原ほか 1997)に定義された「単語意味属性体系」を参照して, 各名詞句標本の変数部分に相当する名詞を意味属性番号に置き換え ,事例集合 を作成する.ただし,名詞は複数の意味的な用法を有する場合が多いが,こ こでは,各名詞の名詞句内での意味を考え,単一の意味属性に置き換える.
以下,このようにして得られた事例集合から構造規則を生成し,得られた 規則を実際の名詞句の係り受け解析に適用する.解析結果を,あらかじめ人手で 決定しておいた正解と比較して解析規則の解析精度を求める.
実験は,10回のcross-validation法で行う.すなわち,まず,事例標本を規則
生成用の9,000件と解析実験用の1,000件に分け,前者から,すでに述べた方法で
解析規則を生成する.得られた規則を後者の標本の解析に適用して解析精度を求
める.この手順を10回繰り返して得られた結果を平均して,生成される規則数と
その精度を求める.図9に実験の手順を示す.