次へ: 評価の向上について
上へ: 考察
戻る: 抽出された対訳パターンについて
  目次
英和辞典5,000文では73.8%、20,000文では79.7%の正解率が得られた。原文デー
タを増やした際、約6%正解率が上昇し、効率良く対訳パターンの抽出ができた。
しかし、さらに大規模なコーパスへ適用した場合に、正解率が下がることも考
えられる。正解率が低い場合は×の評価が多いということだが、対訳パターンも
存在しているので、効率は悪くなるが対訳パターンの抽出は可能だと考えられる。
しかし、大規模なコーパスへ適用して対訳パターンを抽出しても、最初に抽出
された対訳パターンと同じものが繰り返し抽出され、対訳パターンが増えないこ
とも考えられる。よって、今後は、正解率が何%位で対訳パターンが増えなくな
るのかを探っていくことも必要だと考えられる。
平成14年4月17日