次へ: 実験の様子
上へ: 汎化・無効化の効果の実験
戻る: 実験の目的
目次
実験には,実際に文を入力して,パターンの被覆率を求める.
テスト用の入力文は形態素解析結果123,016文(=)を使用する.
入力文と文型パターン辞書を文型パターンパーサ[5]を用いて照合を
行い,照合結果から,以下の項目(i)〜(v i)
を調べる.
- (i)
- アンマッチ:文法・単語レベル123,016文中どのパターンにもマッチしなかった文数
- (i i)
- 自己パターンにのみマッチ:テスト文から作成された文型パターンにのみマッチした文数
- (i i i)
- 他パターンにのみマッチ:テスト文から作成された文型パターン以外の文型パターンにのみマッチした文数
- (i v)
- 自己パターン他パターン共にマッチ:テスト文から作成された文型パターンとテスト文から作成された文型パターン以外の文型パターンが共にマッチした文数
- (v)
- 完全一致適合パターン数:入力文のすべての要素が文型パターンの要素と適合する文型パターンの総数
- (v i)
- 部分一致適合パターン数:入力文の一部の要素が文型パターンに定義されない要素となる文型パターンの総数
「自己文型パターン」以外の適合文型パターンが1つ以上存在し
た入力文の数は(i i i)と(i v)を足したもので,適合文型パターン数は(v)と(v i)を足したものである.文型再現率と平均適合パターン数の実測値は,それぞれ(1)
式,(5)式にテスト用入力文の数,,の実測値を代入して求める.
[2]より,基準パターン辞書の被覆率のパラメータおよびの近似
式の係数は,以下のようになる.
したがって,およびの実測値と近似式の係数を(7)式,(8)
式に代入し,およびを求め,
およびをとし,(6)式よりとを求める.
平成17年3月22日