Next: 本手法の問題点と課題
Up: No Title
Previous: 共通要素による規則
毎日新聞科学欄、経済欄(総数97,912文)から述部を6つ以上含み形態素解析の失
敗のないもの107文を取りだし、その中から連体節述語と複合連体節を構成する
可能性のある連用節述語のペア(総数171)に対して作成したルールを以下の手順
で適用する。
[1] 結合価パターンのマッチにより格要素と用言の組を得る(4.2参照)
[2] 用言意味属性と名詞意味属性による規則で係り受けを判定(4.3参照)
[3] 残りのペアに対して共通要素により並列関係によって係り受けを判定(4.4参照)
Table:
実験結果
|
従来法 |
提案手法 |
[0pt][0pt]分類 |
正 |
誤 |
正 |
誤 |
係る |
25 |
38 |
34 |
29 |
(63) |
(14%) |
(22%) |
(19%) |
(16%) |
係らない |
90 |
18 |
104 |
4 |
(108) |
(52%) |
(11%) |
(61%) |
(2%) |
合計 |
115 |
56 |
138 |
33 |
(171) |
(67%) |
(32%) |
(80%) |
(19%) |
規則を適用した結果、係る場合を正しく係ると判定する場合が25件から34件に、
係らない場合を正しく係らないと判定する場合が90件から104件に増え、全体で
の正解率は80.7%となった。また、従来の手法で正しく解析できるが、本手法で
誤る例は、係る場合の判定において8件、係らない場合の判定において3件で合計
11件であった。解析例を図に示す。
日英機械翻訳システムALT-J/Eの連体節における誤りが誤り全体の35%だったこ
とを考えると、10%余りを改善できる可能性がある(表 )。
asano
2000-03-15