単語数の多さが原因である誤りの解決法について

本節では,単語数の多さが原因である誤りを解決する方法を提案する.
 解決方法の1つは,文の単語数によって正規化を行うことである. 正規化を行うことで,単語数が多いほど選択されやすい問題を解決できる.
 2つめの解決方法として,翻訳確率の計算式にargmaxを用いる方法を提案する. 各日本語単語について最多の共起回数を持つ英語単語のみの組み合わせ情報を用いることで,問題を解決する. 式8.1に,PMIの計算式にargmaxを導入した計算式を示す.

186#186 (55)

187#187 : 188#188