next up previous contents
次へ: 実験環境 上へ: 提案手法 戻る: 提案手法の手順   目次

抽出方法

精度の高い文の抽出には,英語学習文から得た$N$-gramモデルを用いる. 日本語学習文の翻訳文において,$N$-gramの尤度の高い文を抽出する.また,文の長さによる偏りを防ぐため, 単語数で正規化を行う.抽出の際の閾値は,正しい文のまとまりである英語学習文の尤度の平均値とする.



平成23年3月3日