構造規則生成実験によって生成された規則数とそれを使用した名詞句の解析実験
の結果をまとめて表2に示す.表中,「デフォールト規則」の欄は,解析実験に
おいて,適用できる規則が存在しない事例はすべて,「b係り」と解釈したこと
を示す.規則生成に使用する事例数の閾値は,一次元規則と二次元規則の生成
では2,三次元規則の生成では,1とし,例外事例に関する閾値は0とした.
なお,一次元規則,二次元規則の生成において,それぞれの3タイプの構造規則
の生成順序を変えても得られた構造規則全体の解析精度は変わらなかった.
<規則抽出結果>
表2から,構造規則生成の結果について以下のことが分かる.
このうち,2),3)から,この種の名詞句は,三つの名詞のうち二つの意味関係に よって係り受け関係が決まることが多く,三つの名詞すべてに依存する場合は少 ないことが分かる .
表2 生成された構造規則の数と精度 | |||||||
番号* | 構造規則種別 | 規則のタイプ | 得られた規則数 | 規則適用回数 | 累積の事例数 | 精度 | |
1 | 89.6 | 800 (8.0%) | 800 (8.0%) | 92.0% | |||
2 | 一次元規則 | 81.5 | 小計 | 591 (5.9%) | 1,391 (13.9%) | 88.7% | |
3 | 27.3 | 198 | 253 (2.5%) | 1,644 (16.4%) | 89.3% | ||
4 | 888.8 | 4,187 (41.9%) | 5,831 (58.3%) | 90.6% | |||
5 | 二次元規則 | 355.1 | 小計 | 1,917 (19.2%) | 7,748 (77.5%) | 89.0% | |
6 | 236.2 | 1480 | 782 (7.8%) | 8,530 (85.3%) | 77.5% | ||
7 | 三次元規則 | 136 | 453 (4.5%) | 8,983 (89.8%) | 68.4% | ||
-- -- | 合計 | -- -- -- | 1,815 | 8,983 | 8,983 (89.8%) | 88.0% | |
- - - - | デフォールト規則 | 係り | - - - - | 1,017 (10.2%) | 10,000 (100%) | 66.6% | |
合計 | - - - - - | 1,815 | 10,000 (100%) | 10,000 (100%) | 85.8% | ||
(.)規則生成の順序,及び解析での規則適用の順序 |
<解析実験結果>
次に,上記の解析規則を使用した名詞句解析実験の結果から,以下のことが観察 される.
このうち1)は,従来の人手で作成された規則(宍倉,宮崎 1995;江尻, 宮崎 1998)の精度(前後)より若干低いが,本論文と同一の名詞句に対する従来の 要素合成法的な解析規則(中井ほか 1998)より,かなり優れている .2)は, 一次元規則と二次元規則を生成する段階で,事例の多くが使用済みとなり,三次 元規則の生成に使用された事例が少ないためと考えられる.また,3)の値は,人 間でも判断に迷う事例が程度存在する ことを 考えると,かなり良い値と解釈される.