次へ: 係り先決定実験
上へ: 係り先データの作成
戻る: 多数決の必要人数決定
目次
多数決必要人数の考察により多数決は3人が適当であるという結果を
得た.そこで,予備実験により集められた作業者10人から3人組を複数作り,
2,000件のの名詞句に対し,一件あたり3人で判定を行い,3人組による係り先
の多数決を行った.
本研究では,多数決の結果,3対0となったものを,「3:0型」,
2対1となったものを「2:1型」,1対1対1となったものを「1:1:1型」と表す.
また,作成したデータの係り先が京大コーパスの係り先と一致した
ものを「京大一致」,不一致だったものを「京大不一致」と表す.
多数決の結果(図3)は,3対0型が1,390件で69.5%と全体の7割近くを占めた.それ以外
では,2:1型が536件で26.8%,1:1:1型が74件で3.7%となった.この結果から,
付与者の係り先判断がかなり一致したものであったことがわかる.次に,3対0型,
2対1型となったものの係り先の内訳を示す.
3対0型で判定され係り先が付与されたものの結果(図4)は,「A係り」が916件で
約70%,「B
係り」が468件で約34%,「AB係り」が6件で0.4%となった.
2:1型で判定され係り先が付与されたものの結果(図5)は,「A係り」が299件で約56%,
「B係り」が191件で約36%,「AB係り」が42件で約8%,「範囲外」が,4件で約1%となっ
た.3:0型と比較すると,「B係り」の割合はそれほど変わらないが,「A係り」の数が約
15%ほど少なくなっている.また,「AB係り」の割合が大きく増えている.「範
囲外」も
少数では有ったが,4件あった.以下に3:0型,2:1型において「A係り」または,
「B係り」と係り先が一方に付与されたものについて,京大コーパスの係り先と
一致した件数を図に示す.
図 6:
3:0型で一方に係り先が付与されたものと京大コーパスとの一致件
数
|
図 7:
2:1型で一方に係り先が付与されたものと京大コーパスとの一致件
数
|
3:0型,2:1型共に「B係り」と判定されたもので,京大不一
致となったものが多いことがわかる.つまり今回の判定では,「B係り」である
と判定されたものが,京大コーパスでは「A係り」となっているものが多いことに
なる.これは,一般に修飾語
は,被修飾語を近接させて(「V+AのB」型名詞句ではAの方がVに近接している)
記述される傾向が強いことから,「B係り」が判定しづらくなっていることに起因
していると考えられる.
本研究では,作成データの結果から,2,000件中の1,560件(78%)が京大一致とな
り,信頼の出来るデータであるという結果を得た.
平成19年3月25日