次へ: 統計翻訳の手順
上へ: 日英統計翻訳システム
戻る: 日英統計翻訳システム
目次
統計翻訳とは,翻訳する言語と目的言語の対訳文を大量に収集した対訳データ
を用いて,自動的に翻訳規則を獲得し翻訳を行う,機械翻訳手法の1つである.
統計翻訳では,統計的モデルを学習するアルゴリズムは言語に依存しない.
したがって,大量の対訳データがあれば多言語化が容易であり,開発時間も抑え
ることが可能である.統計翻訳には,最初に提案された「語に基づく統計翻訳」
と近年提案された「句に基づく統計翻訳」があり,現在は「句に基づく統計翻訳」
が主流となっている.これは,語順の並び替えや文脈における訳語の選択や翻訳
精度において,「句に基づく統計翻訳」の方が「語に基づく統計翻訳」よりも優
れているためである.また統計翻訳の特徴として,文法構造が似ている言語間で
は翻訳精度が高くなる傾向があり,文法構造の異なる言語間では翻訳精度が低くなる
傾向がある.
平成24年3月23日