next up previous
次へ: (3)規則生成に使用する事例数の閾値について 上へ: 検討 戻る: (1)「逐次型生成」と「同時型生成」の比較

(2)事例数と構造規則の関係について

表1で示されるように,実験では,学習事例に含まれる名詞の種類は,異なり意 味属性数から見て,半分弱に止まっており,決して,網羅的とは言えないが,得 られた構造規則のカバー率は,表2に示されるように89.8%に上っている.この ことから,本方式では,比較的少ない事例から,カバー率の高い構造規則が得ら れることが分かる.

次に,得られた構造規則の数と精度について見ると,表2の結果では,意味属性 を使用した構造規則として,名詞句の事例1万件から1,815件の係り受け構造規 則が得られている.本方式では,意味属性によって表現構造とクラスの関係が規 定できる事例から構造規則は生成され,それ以外の事例は,字面のままの規則と して残されるから,得られた構造規則において,元の事例の持つ情報量は失われ ない.従って,用例翻訳(長尾 1984;佐藤 1992)など,用例そのものを使用す る方法に比べ,精度を落とすことなく,言語知識を$1/5$以下に圧縮する効果が 期待できる[*] ,また,本方式で得られた構造規則は,意味属性番号や文法属性番 号を意味属性名や文法属性名に書き換えると,可読性が高いから,人手によって さらに圧縮できる可能性がある.

ところで,最近の記憶装置の価格を考えると,実用上,規則数が多少多いことは あまり問題にならなくなってきた.これに対して,すでに述べたように,言語表 現はきわめて多彩であり,構造的,意味的な曖昧性を解消するための知識を人手 によって集積するのは,依然として,大変困難な課題である.本論文で提案した 方法は,比較的少量の標本から,表現とその解釈に関する精度の良い構造知識を 手軽に収集できる方法として,実用性が高いと期待できる.


Jin'ichi Murakami 平成13年9月13日