next up previous contents
: 結論 : 考察 : 形態素解析のミスがあった場合   目次

全体的な特徴

高い正答率が得られ、単文においてはほぼ点数計算と受身、使役対応が 有効である事が判明したが、全体として以下の特徴が見られた。
1)結合価パターンは、比較的数字に関する名詞への対応は弱い。
2)固有名詞に対しての対応はほとんど出来ない。
3)格要素の多い文に対しては省略が多すぎると対応が難しい。
4)登録パターンは不足である。
5)格助詞の用法によっては対応が出来ない物がある。
6)二重主格文(主語が2つ存在する文)に関しては適応しにくい。
7)受身に対して格変化規則が必要なパターンが多い。
7であるが、今回使用したパターンが能動態主体であったために 起こった問題で、実際は受身用のパターンを登録すれば 解決は可能であると思われる。 また、失敗例であるが、現在の状況から見るに、 現状以上の精度向上は難しい問題となる。 現在のバランス付けを変えたとしても、正答率はほぼ変わらない。 単文である故に、高い正解率を誇るとも思うので、 複文、重文には、法則の追加が必要である。 二重主格文に関しても、別法則が必要となる。 「は」格の格変化で解消できる問題と考え、 今回の場合「は」格での変換ミスと同じ扱いにしてある。 「は」格での変換ミスは、二重主格文か、もしくは 二重主格文の省略形である文が殆どだからである。 正解となった場合というのは2つある主格の内、前の主格を無視して 選択しての正解であり、二重主格文自体への対応には至っていない。 また、格変化による対応は難しいと考えている。 パターン無しについては、「〜する」という系統の動詞、 または複数動詞を組み合わせた動詞が無い場合が目立った。 「〜する」については、名詞と「する」を格助詞で分けて 「〜をする」という様な形式にすると認識精度上がると思われる。



平成14年4月10日