次へ: 評価
上へ: 本手法の手順
戻る: 対応率の算出
  目次
対応率を求めることで得られた対訳パターンから、対応率が50%以上で一致数が
2以上のものを対訳パターンの候補として抽出する。
- 対応率を50%以上としたのは、対応率が50%より低い場合は、対訳パター
ンである可能性が低いと判断したためである。
- 一致数を2以上としたのは、文番号の一致数が1の場合は、偶然文番号が一
致している可能性があると判断したためである。
例9で得られた二つの対訳パターンは、共に対応率が50%以上で一致数が2以上
となっているので、二つとも対訳パターンとして抽出される。
ここで、例10のような対訳パターンが得られた場合を考える。
(例10)
パターンA : パターンW ・・・ 対応率80%(4 / 5)
パターンB : パターンX ・・・ 対応率20%(1 / 5)
パターンC : パターンY ・・・ 対応率75%(3 / 4)
パターンD : パターンZ ・・・ 対応率100%(1 / 1)
例10では、対応率が50%以上で一致数が2以上であるパターンAとパターンW、
パターンCとパターンYが対訳パターンとして抽出される。
対訳パターンを抽出した後、人手で評価を行うため、対訳パターンである可能
性が低いものを削除した方が効率良く実験を行うことができる。
平成14年4月17日