次へ: 対応率
上へ: パターンの対応
戻る: パターンの対応
  目次
本研究では、文番号を比較することで対訳パターンを検索する。そして、文番号
が一致していれば対訳パターンとする。
以下に対訳コーパスの例を示す。例5では、パターンAを含む文番号(1)の日本
文とパターンX, Yを含む文番号(1)の英文が対訳で、パターンAを含む文番号(2)
の日本文とパターンX, Zを含む文番号(2)の英文が対訳となっている。
文番号(1)の文で対訳パターンを考えると、パターンAはパターンX, Yのどちら
と対訳となっているのか判断できない。同様に、文番号(2)の文では、パターンA
はパターンX, Zのどちらと対訳となっているのか判断できない。
原文データが増えれば、対訳パターンを含む文も増えるので、対訳であるパター
ン同士の一致数が多くなると考えられる。
そこで、文番号の一致数を求め、一致数が一番多いパターン同士を対訳パター
ンとする。
例5の文番号の一致数は以下のようになる。
A : X = 一致数2(文(1),(2)が一致)
A : Y = 一致数1(文(1)が一致)
A : Z = 一致数1(文(2)が一致)
そして、一致数の多いパターンAとパターンXを対訳パターンとする。
平成14年4月17日