next up previous contents
次へ: 係り先決定実験 上へ: 係り先データの作成 戻る: 多数決の必要人数決定   目次

2,000件のデータに対する付与結果

多数決必要人数の考察により多数決は3人が適当であるという結果を 得た.そこで,予備実験により集められた作業者10人から3人組を複数作り, 2,000件のの名詞句に対し,一件あたり3人で判定を行い,3人組による係り先 の多数決を行った.

本研究では,多数決の結果,3対0となったものを,「3:0型」, 2対1となったものを「2:1型」,1対1対1となったものを「1:1:1型」と表す. また,作成したデータの係り先が京大コーパスの係り先と一致した ものを「京大一致」,不一致だったものを「京大不一致」と表す.

図 3: 3:0型,2:1型,1:1:1型の数
\includegraphics[width=32zw,clip]{zu4.eps}
多数決の結果(図3)は,3対0型が1,390件で69.5%と全体の7割近くを占めた.それ以外 では,2:1型が536件で26.8%,1:1:1型が74件で3.7%となった.この結果から, 付与者の係り先判断がかなり一致したものであったことがわかる.次に,3対0型, 2対1型となったものの係り先の内訳を示す.
図 4: 3:0型の内訳
\includegraphics[width=32zw,clip]{zu5.eps}
3対0型で判定され係り先が付与されたものの結果(図4)は,「A係り」が916件で 約70%,「B 係り」が468件で約34%,「AB係り」が6件で0.4%となった.
図 5: 2:1型の内訳
\includegraphics[width=32zw,clip]{zu6.eps}
2:1型で判定され係り先が付与されたものの結果(図5)は,「A係り」が299件で約56%, 「B係り」が191件で約36%,「AB係り」が42件で約8%,「範囲外」が,4件で約1%となっ た.3:0型と比較すると,「B係り」の割合はそれほど変わらないが,「A係り」の数が約 15%ほど少なくなっている.また,「AB係り」の割合が大きく増えている.「範 囲外」も 少数では有ったが,4件あった.以下に3:0型,2:1型において「A係り」または, 「B係り」と係り先が一方に付与されたものについて,京大コーパスの係り先と 一致した件数を図に示す.

図 6: 3:0型で一方に係り先が付与されたものと京大コーパスとの一致件 数
\includegraphics[width=32zw,clip]{zu2.eps}
図 7: 2:1型で一方に係り先が付与されたものと京大コーパスとの一致件 数
\includegraphics[width=32zw,clip]{zu3.eps}
3:0型,2:1型共に「B係り」と判定されたもので,京大不一 致となったものが多いことがわかる.つまり今回の判定では,「B係り」である と判定されたものが,京大コーパスでは「A係り」となっているものが多いことに なる.これは,一般に修飾語 は,被修飾語を近接させて(「V+AのB」型名詞句ではAの方がVに近接している) 記述される傾向が強いことから,「B係り」が判定しづらくなっていることに起因 していると考えられる.

本研究では,作成データの結果から,2,000件中の1,560件(78%)が京大一致とな り,信頼の出来るデータであるという結果を得た.



平成19年3月25日