next up previous
次へ: 文法属性規則の作成と意味属性規則との併用 上へ: 意味属性規則の生成 戻る: (1)名詞句に使用された名詞とその意味属性

(2)実験結果

構造規則生成実験によって生成された規則数とそれを使用した名詞句の解析実験 の結果をまとめて表2に示す.表中,「デフォールト規則」の欄は,解析実験に おいて,適用できる規則が存在しない事例はすべて,「b係り」と解釈したこと を示す.規則生成に使用する事例数の閾値$\xi$は,一次元規則と二次元規則の生成 では2,三次元規則の生成では,1とし,例外事例に関する閾値$\gamma$は0とした. なお,一次元規則,二次元規則の生成において,それぞれの3タイプの構造規則 の生成順序を変えても得られた構造規則全体の解析精度は変わらなかった.

<規則抽出結果>

表2から,構造規則生成の結果について以下のことが分かる.

  1. 得られた意味属性規則数は,全体で1,815件である.この規則は,9,000 件の事例から得られているから,平均してみれば,5事例から1規則得 られたことになる.
  2. 各次元規則の中で,二次元規則の数が最も多く,$80\%$以上を占めている.
  3. 三次元規則は,136件で,他の次元の規則に比べて最小である.

このうち,2),3)から,この種の名詞句は,三つの名詞のうち二つの意味関係に よって係り受け関係が決まることが多く,三つの名詞すべてに依存する場合は少 ないことが分かる[*]

表2 生成された構造規則の数と精度
番号* 構造規則種別 規則のタイプ 得られた規則数 規則適用回数 累積の事例数 精度
1 $(X,*,*:D)$ 89.6 800 (8.0%) 800 (8.0%) 92.0%
2 一次元規則 $(*,Y,*:D)$ 81.5 小計 591 (5.9%) 1,391 (13.9%) 88.7%
3 $(*,*,Z:D)$ 27.3 198 253 (2.5%) 1,644 (16.4%) 89.3%
4 $(X,Y,*:D)$ 888.8 4,187 (41.9%) 5,831 (58.3%) 90.6%
5 二次元規則 $(*,Y,Z:D)$ 355.1 小計 1,917 (19.2%) 7,748 (77.5%) 89.0%
6 $(X,*,Z:D)$ 236.2 1480 782 (7.8%) 8,530 (85.3%) 77.5%
7 三次元規則 $(X,Y,Z:D)$ 136 453 (4.5%) 8,983 (89.8%) 68.4%
-- -- 合計 -- -- -- 1,815 8,983 8,983 (89.8%) 88.0%
- - - - デフォールト規則 $b$係り - - - - 1,017 (10.2%) 10,000 (100%) 66.6%
合計 - - - - - 1,815 10,000 (100%) 10,000 (100%) 85.8%
($*$.)規則生成の順序,及び解析での規則適用の順序

<解析実験結果>

次に,上記の解析規則を使用した名詞句解析実験の結果から,以下のことが観察 される.

  1. 1万件の事例から全体で,カバー率$89.8\%$の規則が得られる.また,規 則のカバーする範囲の解析正解率は,平均$88.0\%$である.
  2. 一次元規則と二次元規則の精度は,ほぼ,同程度であるのに対して,三 次元規則の精度は低い.
  3. 適用できる規則の存在しない事例は,すべて,「b係り」と解釈した結 果,全体の正解率は,$85.8\%$である.

このうち1)は,従来の人手で作成された規則(宍倉,宮崎 1995;江尻, 宮崎 1998)の精度($90\%$前後)より若干低いが,本論文と同一の名詞句に対する従来の 要素合成法的な解析規則(中井ほか 1998)より,かなり優れている[*] .2)は, 一次元規則と二次元規則を生成する段階で,事例の多くが使用済みとなり,三次 元規則の生成に使用された事例が少ないためと考えられる.また,3)の値は,人 間でも判断に迷う事例が$10\%$程度存在する[*] ことを 考えると,かなり良い値と解釈される.


next up previous
次へ: 文法属性規則の作成と意味属性規則との併用 上へ: 意味属性規則の生成 戻る: (1)名詞句に使用された名詞とその意味属性
Jin'ichi Murakami 平成13年9月13日