Next: 考察
Up: 名詞の意味を介した複合的連体節の構造解析について
Previous: 共通要素による規則
毎日新聞科学欄、経済欄(総数97,912文)から述部を6つ以上含み形態素解析の失
敗のないもの107文を取りだし、その中から連体節述語と複合連体節を構成する
可能性のある連用節述語のペア(総数171)に対して作成したルールを以下の手順
で適用する。
[1] 結合価パターンのマッチにより格要素と用言の組を得る(4.2参照)
[2] 用言意味属性と名詞意味属性による規則で係り受けを判定(4.3参照)
[3] 残りのペアに対して共通要素により並列関係によって係り受けを判定(4.4参照)
Table:
実験結果
|
従来法 |
提案手法 |
[0pt][0pt]分類 |
正 |
誤 |
正 |
誤 |
係る (63) |
25(14%) |
38(22%) |
34(19%) |
29(16%) |
係らない (108) |
90(52%) |
18(11%) |
104(61%) |
4(2%) |
合計 (171) |
115(67%) |
56(32%) |
138(80%) |
33(19%) |
規則を適用した結果、係る場合を正しく係ると判定する場合が25件から34件に、
係らない場合を正しく係らないと判定する場合が90件から104件に増え、全体で
の正解率は80.7%となった。また、従来の手法で正しく解析できるが、本手法で
解析を誤る例は、係る場合の判定において8件、係らない場合の判定において3件
で合計11件であった。
解析例を図に示す。この場合、連用節「落ちても」の要素とし
ては「吸着力が」が、また、連体節「維持する」の要素としては、「仕組みが」
「吸着力を」が候補として挙がり、「落ちる」「維持する」の用言意味属性はそ
れぞれ「相対関係」「行動」が選ばれる。また各格要素の名詞意味属性は、「落
ちる」の要素とされた「吸着力」が「性質」としての「吸着力」、「維持する」
の要素とされた「仕組み」「吸着力」は、それぞれ「構造」「力(物)」として格
を埋めている。このうち、どちらの節にも存在する「吸着力」という名詞の「性
質」「力(物)」という意味属性は親子関係にあり、優先順位が12番にあたる「親
子関係」の規則に適合し、「係る」と判断される。
日英機械翻訳システムALT-J/Eの連体節における誤りが誤り全体の35%だったこ
とを考えると、10%程度を改善できる可能性がある(表 )。
asano
2000-03-15