(手順2)における「〜32位」と(手順4)における「〜32位」の正解率の差より, 正解するはずの候補文が,意味的削除で削除されてしまった量がわかる. その原因を,実験3の結果より調べ,表6にまとめる.
原因 | 件数 |
(2-1)結合価パターンの名詞意味属性の | |
制約が不足 | 10 |
(2-2)任意格データベースに登録された | |
名詞意味属性の制約が不足 | 7 |
(2-3)結合価パターンの不足 | 5 |
(2-4)接続辞書のデータ不足 | 4 |
(2-5)格変化規則が不適切 | 3 |
以下に具体例を載せる.
「国籍」の意味属性は「(1203 籍)」であり, (3主体 1236人間活動)の意味属性とは親子関係にないため, パターンが適合せず,正解文が削除された.
正解文には,任意格の「に格」が含まれている. しかし,任意格のデータベース中に 「内部(2623 内部)に」に対応する意味属性が無いので,正解文が削除された.
「生々しい」は,単語辞書には登録されているが, 結合価パターン辞書には「生々しい」が存在しない. よって,正解文が削除された.
「派遣予定」の名詞の接続において「派遣」と「予定」の接続が 接続辞書に載っていないため,正解文が削除された.
「見解は」の対応する部分は「N2(*)を」なので, 「は格」を「を格」に変化させなくてはならない. しかし,格変化規則では,「は格」を「が格」に変換することが優先されるため, 結合価パターンが誤って適合したことが原因で,正解文が削除された. 「が格」を優先した理由は「は格」を 「が格」,および,「を格」の両方と対応させた場合, 誤った判断をすることが動作確認の際に多く見られたためである. 例えば,「私は作る」の誤り文で「渡しは作る」という文がある. この場合,「を格」を用いると「渡し(橋)を作る」と解釈されてしまう. そのため,本稿では使用を控えている.
以上より, (原因2-1)〜(原因2-4)ではデータベースの拡充, (原因2-5)では格変化規則の改良がそれぞれ必要となる. これらについては改良の余地があるため,今後の精度向上が期待できる.