句に基づく統計翻訳は句対応の翻訳モデルを用いる. 原言語文を目的言語文に翻訳する場合に,隣接する複数の単語(フレーズ)を用いて翻訳を行う方法である.本研究では日英方向の翻訳を行うため,日英統計翻訳を説明する.日英統計翻訳システムの枠組みを図2.1に示す.
89#89 |
26#26 |
90#90 |
(21) |
|
91#91 |
92#92 |
(22) |
ここで93#93は翻訳モデル,94#94は言語モデルを示す.94#94が単語であれば“単語に基づく統計翻訳”のモデル,94#94が句であれば,“句に基づく統計翻訳”のモデルとなる.
また,学習データとは対訳文(英語文と日本語文の対)を大量に用意したものである. 学習データに含まれる各々のデータから, 翻訳モデルと言語モデルを学習する.
Subsections