ここで,
は日本語学習文における日本語句
の出現回数であり,
は対訳学習文における対訳句(
,
)の共起回数,
は対訳学習文における日英方向の対数翻訳確率である.
例えば日本語句``部員たち"の出現回数が1回の場合,その日本語句をもつすべての対訳句において,対訳学習文における日英方向の対数翻訳確率は0(最大値)になる.
したがって句の出現回数が1回の場合,不適切な対応をとる対訳句においても高い確率が付与される.
以上のことから,本研究では句の抽出回数または学習文における句の出現回数が少なくとも一方の言語で1回である対訳句を取り除き,モデルの作成を行う.