next up previous contents
次へ: 正解率について 上へ: 考察 戻る: 考察   目次

抽出された対訳パターンについて

本研究では、最初に英和辞典5,000文と新聞記事5,000文に対して実験を行った。 その結果、日英対訳パターンを自動的に抽出することができた。抽出された対訳 パターンは、対応率が高くて文番号の一致数が多ければ、信頼できる対訳パター ンと言える。そのため、さらに一致数を増やす必要があると考えられる。
 原文データを増やすと、対訳パターンを含む文も増え、文番号の一致数が増え ると考えられる。よって、一致数を増やすためには大規模なコーパスへの適用が 必要である。
 そこで、英和辞典20,000文に対して実験を行ったが、一致数はあまり増えな かった。そのため、さらに大規模なコーパスへの適用が必要であると考えられる。
 しかし、英和辞典5,000文では対訳パターンが31個抽出されたのに対し、英和 辞典20,000文では177個抽出された。このように、原文データを増やすことで対 訳パターンを増やすことができた。



平成14年4月17日