次へ: 目次
上へ: 11
戻る: 11
目次
現在,機械翻訳システムの分野において,対訳データから自動的に翻訳規則を獲得
し,翻訳を行う統計翻訳が注目されている.
統計翻訳では,単語列から単語列への翻訳を確率的に行うためにフレーズテーブ
ルを用いる.自動作成されるフレーズテーブルは作成されるフレーズ数が多いた
め,カバー率は高いが,フレーズ対の信頼性は低い.一方,人手で作成する場合
は翻訳対の信頼性は高いがカバー率は低い.そこで,それぞれの長所を生かすた
めに,プログラムで自動作成したフレーズ対に人手で作成した翻訳対を追加する
ことを考えた.
人手で作成された約13万の翻訳対に翻訳確率を与え,プログラムで自動作成したフ
レーズテーブルに追加した結果,BLEUスコアの値が,日英翻訳の単文は0.9,
重文複文では0.8向上した.また,英日翻訳では単文は1,重文複文は
2.5向上した.結果から,人手で作成した翻訳対を追加した提案手法は有効
であることが示された.
平成21年3月17日