next up previous contents
次へ: 評価の向上について 上へ: 考察 戻る: 抽出された対訳パターンについて   目次

正解率について

英和辞典5,000文では73.8%、20,000文では79.7%の正解率が得られた。原文デー タを増やした際、約6%正解率が上昇し、効率良く対訳パターンの抽出ができた。
 しかし、さらに大規模なコーパスへ適用した場合に、正解率が下がることも考 えられる。正解率が低い場合は×の評価が多いということだが、対訳パターンも 存在しているので、効率は悪くなるが対訳パターンの抽出は可能だと考えられる。
 しかし、大規模なコーパスへ適用して対訳パターンを抽出しても、最初に抽出 された対訳パターンと同じものが繰り返し抽出され、対訳パターンが増えないこ とも考えられる。よって、今後は、正解率が何%位で対訳パターンが増えなくな るのかを探っていくことも必要だと考えられる。



平成14年4月17日