next up previous contents
次へ: 評価 上へ: 本手法の手順 戻る: 対応率の算出   目次

対訳パターンの候補を抽出

対応率を求めることで得られた対訳パターンから、対応率が50%以上で一致数が 2以上のものを対訳パターンの候補として抽出する。


 例9で得られた二つの対訳パターンは、共に対応率が50%以上で一致数が2以上 となっているので、二つとも対訳パターンとして抽出される。
 ここで、例10のような対訳パターンが得られた場合を考える。

(例10)
パターンA : パターンW ・・・ 対応率80%(4 / 5)
パターンB : パターンX ・・・ 対応率20%(1 / 5)
パターンC : パターンY ・・・ 対応率75%(3 / 4)
パターンD : パターンZ ・・・ 対応率100%(1 / 1)

 例10では、対応率が50%以上で一致数が2以上であるパターンAとパターンW、 パターンCとパターンYが対訳パターンとして抽出される。
 対訳パターンを抽出した後、人手で評価を行うため、対訳パターンである可能 性が低いものを削除した方が効率良く実験を行うことができる。



平成14年4月17日