next up previous contents
次へ: 決定されたパターンでの結果を出力 上へ: 解析方法 戻る: 標本文の名詞の意味属性を抽出   目次

取り出したデータと動詞に対する結合価パターンを比較

先に抽出した動詞に対する結合価パターンと例文を比較する。

例6:事故で死亡した ドライバー遺品

例6の「死亡する」のパターンはP1になる。
P1:$N1$(人)が$N2$(災難)で死亡する

例6に適合する名詞の意味属性を抽出すると、事故(事件)、ドライバー(運転手)、遺品(持ち物)となる。
例文がパターンに当てはまるか比較する。
・で格「事故」の意味属性は(事件)で、パターンので格「$N2$(災難)」の
 下位属性なので内包される。
・ドライバーの意味属性は(運転手)で、パターンのが格「$N1$(人)」の
 下位属性なので内包される。
・遺品の意味属性は(持ち物)で、「$N1$(人)」に内包されない。
$N1$に対応するのは「ドライバー」であり、「死亡する」は「ドライバー」に係ると判断する。

この例の場合、P2のパターンでもデータが一致し、結果は上記パターンと同様となる。
P2:$N1$(人)が $N2$(*)で 死亡する

データとパターンの比較は、基本的に結合価パターンの適合性に準じて行う。ただし、標本中では「」に囲われる名詞は動詞節の係り先となっているので、その場合はパターンを使用しない。また、パターンが適用できない場合は意味属性で判断する。具体的には5つの段階に分けることができる。

1.名詞A又はBに「」もしくは””が存在
        ↓
2.結合価パターンに適合
        ↓
3.省略を含むパターンに適合
        ↓
4.意味属性が全て受けつけるパターンが存在し適合
        ↓
5.パターンの$Nx$の意味属性に適合

以下に、それぞれについて説明する。

(1)名詞A又はBに「」もしくは””が存在
新聞データから取り出した500文中34文について、係り先となる名詞A又はBが「」もしくは””で囲われており、その名詞が正解と一致していた。よって「」もしくは””で囲われている名詞を無条件に結果として出力する。

例7:地方自治を考える「列島ロジー」第一部
名詞Aの「列島ロジー」が「」で囲われているため、動詞「考える」は名詞「列島ロジー」に係ると判断する。

(2)結合価パターン
結合価パターンに適合したとき、パターンに当てはまった方の名詞を結果とする。

例8:寄付金を扱う自治体巨大イベント
「を格」の格要素「寄付金」の意味属性は(金銭)
名詞Aの「自治体」の意味属性は(行政機関)
名詞Bの「イベント」の意味属性は(催し)
例8の「扱う」のパターンはP3になる。
P3:$N1$(主体,機械)が$N2$(*)を扱う
$N1$の意味属性に内包されるのは名詞Aの 方なので、「扱う」は「自治体」に係ると判断する。

適合するパターンが複数存在し、格要素数が違う場合
当てはまる結合価パターンが複数存在することもある。その場合、パター ンに含まれる格要素数が多い方の結果を優先する。例えば
$N1$$N2$に〜する
$N1$$N2$$N3$に〜する
の両方のパターンで当てはまった場合、格要素が3つある後者の評価を結果とする。

適合するパターンが複数存在し、格要素数が同じ場合
当てはまる結合価パターンが複数存在し、格要素数が同じ場合は、名詞A又はBに対応する格要素の種類に応じて優先度を決め、その優先度の高い方の評価を結果とする。格要素の種類での優先度は次の通りである。

が > を に > で へ > の > と から まで より

 
例えば、
$N1$$N2$に〜する
$N1$$N2$で〜する
の両方のパターンで当てはまり、名詞A又はBが$N2$に対応していたとすると、「に格」の方が「で格」よりも優先度が高いので、前者の評価を結果とする。
また、格要素の種類での優先度は、標本データでの頻出度に応じて作成した。

(3)省略を含むパターン
元の結合価パターンから$N1$(が格)を除いたパターンで比較する。

例9:収容されたロシア兵捕虜姿
名詞Aの「捕虜」の意味属性は(囚人・捕虜)
名詞Bの「姿」の意味属性は(形,姿)
例9の「収容する」のパターンで(1)(2)の方法に当てはまらず、P4から$N1$を省略したパターンに当てはまる。
P4:$N1$(施設)が$N2$(主体,動物)を収容する
$N2$の意味属性に内包されるのは名詞Aの方なので、「収容する」は「捕虜」に係ると判断する。

(4)全ての意味属性が*のパターン
パターン中の意味属性が全て受けつけるパターンと比較する。

例10:企業収益を維持する経営トップ姿勢
「を格」の格要素「収益」の意味属性は(利益)
名詞Aの「トップ」の意味属性は(等級)
名詞Bの「姿勢」の意味属性は(態度)
例10では「維持する」のパターンで(1)〜(3)の方法にあてはまらず、P5に当てはまる。
P5:$N1$(*)が$N2$(*)を維持する
$N1$$N2$ともに意味属性が全て受けつける属性なので、「維持する」は「トップ」、「姿勢」の 両方に係ると判断する。

(5)パターンの$Nx$の意味属性と、名詞A、Bの意味属性を比較し、適合
$N1$の意味属性から順に名詞A、Bの意味属性と比較していく。比較 する$Nx$の格要素の種類によって優先度を決めておき、より優先度の高いものでの評 価を結果として採用する。格要素の種類での優先度は前述(2)でのものと同様であ る。
 例えば「$N1$$N2$から$N3$に〜する」において、「に格」$N3$で名詞Bが当てはまったら、「に格」の方が優先度が高いので、結果は名詞Bに 係るように判断する。

例11:視察に行く議員選考方法
「に格」の格要素「視察」の意味属性は(検査)
名詞Aの「議員」の意味属性は(政治家,人<地位>)
名詞Bの「方法」の意味属性は(方法)
例11では「行く」の結合価パターンで(1)〜(4)の方法に当てはまらないので、各結合価パターンについて、$Nx$の意味属性と名詞A、Bの意味 属性を比較する。この結果、P6が選択される。
P6:$N1$(主体,動物)が$N2$(道路)を行く
$N1$に名詞Aが内包され、「が格」は最優先なので、「行く」 は「議員」に係ると判断する。

比較評価の優先度は(1)が最も高く、(5)が最も低い。(1)の評価から順に行い、比 較評価での結果が出た時点でそのデータでの解析は終了し、それ以降の比較評 価はスキップする。


平成14年2月28日