適合頻度0の文型パターンは,日常的には使われない表現が多く, 削除が辞書の精度に与える影響は小さいことが分かった. しかし,日本語文型パターンの包含関係を用いると正解率が低下することが分かった. そのため,英語文型パターンも考慮し,日英両方の文型パターンの包含関係を用いる必要がある. また,過剰に汎化された文型パターンを辞書から削除すると, 再現率は減少したが,意味的な被覆率が変化しなかったことから, このような文型パターンが辞書に悪影響を与えていたことが確認出来た.
今後は,再現率を維持したまま,正解率も維持する辞書の削減方法を考えていく. そのためには,日英の文型パターンが共に包含関係にあるものに着目する方法が考えられる.