データとパターンの比較は、基本的に結合価パターンの適合性に準じて行う。ただし、標本中では「」に囲われる名詞は動詞節の係り先となっているので、その場合はパターンを使用しない。また、パターンが適用できない場合は意味属性で判断する。具体的には5つの段階に分けることができる。
1.名詞A又はBに「」もしくは””が存在
↓
2.結合価パターンに適合
↓
3.省略を含むパターンに適合
↓
4.意味属性が全て受けつけるパターンが存在し適合
↓
5.パターンのの意味属性に適合
以下に、それぞれについて説明する。
(1)名詞A又はBに「」もしくは””が存在
新聞データから取り出した500文中34文について、係り先となる名詞A又はBが「」もしくは””で囲われており、その名詞が正解と一致していた。よって「」もしくは””で囲われている名詞を無条件に結果として出力する。
例7:地方自治を考える「列島ロジー」の第一部
名詞Aの「列島ロジー」が「」で囲われているため、動詞「考える」は名詞「列島ロジー」に係ると判断する。
(2)結合価パターン
結合価パターンに適合したとき、パターンに当てはまった方の名詞を結果とする。
例8:寄付金を扱う自治体の巨大イベント
「を格」の格要素「寄付金」の意味属性は(金銭)
名詞Aの「自治体」の意味属性は(行政機関)
名詞Bの「イベント」の意味属性は(催し)
例8の「扱う」のパターンはP3になる。
P3:(主体,機械)が(*)を扱う
の意味属性に内包されるのは名詞Aの
方なので、「扱う」は「自治体」に係ると判断する。
適合するパターンが複数存在し、格要素数が違う場合
当てはまる結合価パターンが複数存在することもある。その場合、パター
ンに含まれる格要素数が多い方の結果を優先する。例えば
がに〜する
がをに〜する
の両方のパターンで当てはまった場合、格要素が3つある後者の評価を結果とする。
適合するパターンが複数存在し、格要素数が同じ場合
当てはまる結合価パターンが複数存在し、格要素数が同じ場合は、名詞A又はBに対応する格要素の種類に応じて優先度を決め、その優先度の高い方の評価を結果とする。格要素の種類での優先度は次の通りである。
が > を に > で へ > の > と から まで より |
(3)省略を含むパターン
元の結合価パターンから(が格)を除いたパターンで比較する。
例9:収容されたロシア兵捕虜の姿
名詞Aの「捕虜」の意味属性は(囚人・捕虜)
名詞Bの「姿」の意味属性は(形,姿)
例9の「収容する」のパターンで(1)(2)の方法に当てはまらず、P4からを省略したパターンに当てはまる。
P4:(施設)が(主体,動物)を収容する
の意味属性に内包されるのは名詞Aの方なので、「収容する」は「捕虜」に係ると判断する。
(4)全ての意味属性が*のパターン
パターン中の意味属性が全て受けつけるパターンと比較する。
例10:企業収益を維持する経営トップの姿勢
「を格」の格要素「収益」の意味属性は(利益)
名詞Aの「トップ」の意味属性は(等級)
名詞Bの「姿勢」の意味属性は(態度)
例10では「維持する」のパターンで(1)〜(3)の方法にあてはまらず、P5に当てはまる。
P5:(*)が(*)を維持する
、ともに意味属性が全て受けつける属性なので、「維持する」は「トップ」、「姿勢」の
両方に係ると判断する。
(5)パターンのの意味属性と、名詞A、Bの意味属性を比較し、適合
の意味属性から順に名詞A、Bの意味属性と比較していく。比較
するの格要素の種類によって優先度を決めておき、より優先度の高いものでの評
価を結果として採用する。格要素の種類での優先度は前述(2)でのものと同様であ
る。
例えば「がからに〜する」において、「に格」で名詞Bが当てはまったら、「に格」の方が優先度が高いので、結果は名詞Bに
係るように判断する。
例11:視察に行く議員の選考方法
「に格」の格要素「視察」の意味属性は(検査)
名詞Aの「議員」の意味属性は(政治家,人<地位>)
名詞Bの「方法」の意味属性は(方法)
例11では「行く」の結合価パターンで(1)〜(4)の方法に当てはまらないので、各結合価パターンについて、の意味属性と名詞A、Bの意味
属性を比較する。この結果、P6が選択される。
P6:(主体,動物)が(道路)を行く
に名詞Aが内包され、「が格」は最優先なので、「行く」
は「議員」に係ると判断する。
比較評価の優先度は(1)が最も高く、(5)が最も低い。(1)の評価から順に行い、比
較評価での結果が出た時点でそのデータでの解析は終了し、それ以降の比較評
価はスキップする。