次へ: 実験 上へ: 提案手法 戻る: c)対訳句抽出における対数翻訳確率　 , 目次

確率の付与

従来手法は対訳句の確率として対数フレーズ確率を用いている．一方，本研究では対訳句の確率としてロジスティック回帰分析から得た確率を用いる．

まず，自動抽出した対訳句の従属変数および独立変数を用いてモデルの学習を行い，線形回帰モデル（式(3.4)）の定数および回帰係数を推定する. 次に，得られた定数および回帰係数を式(3.3)に代入し，本研究におけるロジスティック回帰モデルを作成する．そして，自動抽出した対訳句に付与された各独立変数をロジスティック回帰モデルに代入し，確率を得る．この確率をロジスティック回帰分析から得た確率と呼ぶ．なお，対数フレーズ確率と同様に，ロジスティック回帰分析から得た確率についても対数をとる．ロジスティック回帰分析の従属変数の設定において，人手で作成した対訳句と一致する対訳句は適切な対応をとる（ =1）と仮定しているため，ロジスティック回帰分析から得た確率は対訳句が適切な対応をとる確率を表している．最後に，従来手法における対数フレーズ確率をロジスティック回帰分析から得た確率に置き換え，パターンに基づく日英統計翻訳を行う．

平成27年3月13日