next up previous contents
次へ: 翻訳モデル 上へ: 日英統計翻訳システム 戻る: 日英統計翻訳システム   目次

句に基づく統計翻訳システム

句に基づく統計翻訳とは,翻訳する言語と目的言語の対訳文を大量に収集した対訳データ を用いて,自動的に翻訳規則を獲得し翻訳を行う,機械翻訳手法の1つである. 以下に,句に基づく統計翻訳の例を示す.

日英統計翻訳は,日本語文Jが与えられたとき,全ての組み合わせから確率が最大となる英語文Eを探索し翻訳を行う. 翻訳モデルは 1#1 ,言語モデルは2#2 である.図2.1に句に基づく統計翻訳の手順を示す.

3#3 4#4 5#5 6#6 7#7
図: 句に基づく統計翻訳の手順
8#8

図2.1で示すように,翻訳モデルは日本語コーパスと英語コーパスが集まった,学習 データから学習して作成する.また,言語モデルは,出力文の言語である英語コーパス から学習して作成する.翻訳モデルと言語モデルを用いて,Eを探索する翻訳システム が図中のデコーダである.



Subsections

root 平成24年3月22日