next up previous contents
次へ: 対応率 上へ: パターンの対応 戻る: パターンの対応   目次

文番号の比較

本研究では、文番号を比較することで対訳パターンを検索する。そして、文番号 が一致していれば対訳パターンとする。
 以下に対訳コーパスの例を示す。例5では、パターンAを含む文番号(1)の日本 文とパターンX, Yを含む文番号(1)の英文が対訳で、パターンAを含む文番号(2) の日本文とパターンX, Zを含む文番号(2)の英文が対訳となっている。
\includegraphics{fig5.eps}
 文番号(1)の文で対訳パターンを考えると、パターンAはパターンX, Yのどちら と対訳となっているのか判断できない。同様に、文番号(2)の文では、パターンA はパターンX, Zのどちらと対訳となっているのか判断できない。
 原文データが増えれば、対訳パターンを含む文も増えるので、対訳であるパター ン同士の一致数が多くなると考えられる。
 そこで、文番号の一致数を求め、一致数が一番多いパターン同士を対訳パター ンとする。
 例5の文番号の一致数は以下のようになる。
      A : X = 一致数2(文(1),(2)が一致)
      A : Y = 一致数1(文(1)が一致)
      A : Z = 一致数1(文(2)が一致)
 そして、一致数の多いパターンAとパターンXを対訳パターンとする。



平成14年4月17日