next up previous contents
次へ: 使用データ基準の変更 上へ: 考察 戻る: 考察   目次

安井らの提案手法にそった規則削減

実験結果は,デフォルト規則を下回る結果となった.その理由として,信頼度の 低い解析方法の影響が考えられる.今回の実験では,デフォルト規則の77.3%を 上回っている信頼度を持っている解析方法はCBS法とIPS法となっている. そこで,CBS法とIPS法による統合方式で実験を行った.その結果を表9 にまとめる.また,cabochaとの比較のために,4.6章で使用した100件のデータ での実験も行った.結果を表10にまとめる.

表 9: CBS法,IPS法,デフォルト規則による統合方式のオープンテスト結果
判定手法 正解率
CBS法,IPS法,デフォルト規則の統合方式 81.1%(305/375)
デフォルト規則 77.3%(290/375)


表 10: cabochaとの比較
判定手法 正解率
CBS法,IPS法,デフォルト規則の統合方式 82%(82/100)
cabocha 73%(73/100)
デフォルト規則 74%(74/100)

表9より正解率が81.1%と向上したことがわかる.正解率向上の要因を考えると IPS法は,カバー率の低さからあまり影響がないと考えられる.そのため, CBS法が大きく正解率向上に影響していると考えられる.CBS法は,形 式名詞,数詞,時詞の特徴に着目した解析方法となっている.このうち,形 式名詞では,形式名詞の自立性の低さに着目することで,形式名詞が名詞A に来ても,名詞Bに来ても「A係り」と判定されるようになっている.これは デフォルト規則と同じことから,形式名詞による 正解率の向上は考えられない.そのため,正解率が向上したのは数詞,時詞に着 目することで,少数である「B係り」を判定できたことが大きな要因であると考えら れる.この結果より,信頼度の極端に低い解析方法であるVCC法などは,統合方 式に加えない方がよいと考えられる.

次に,cabochaと比較した実験では,cabochaの正解率よりも9%向上して82%の 結果となった.このことから,CBS法とIPS法による統合方 式は,「V+AのB」型名詞句の係り先解析においては,一般に使用されている係り 先解析器よりも高い精度を持っていることがわかる.



平成19年3月25日