next up previous contents
次へ: 目次 上へ: 11 戻る: 11   目次

概要

現在,機械翻訳システムの分野において,対訳データから自動的に翻訳規則を獲得 し,翻訳を行う統計翻訳が注目されている. 統計翻訳では,単語列から単語列への翻訳を確率的に行うためにフレーズテーブ ルを用いる.自動作成されるフレーズテーブルは作成されるフレーズ数が多いた め,カバー率は高いが,フレーズ対の信頼性は低い.一方,人手で作成する場合 は翻訳対の信頼性は高いがカバー率は低い.そこで,それぞれの長所を生かすた めに,プログラムで自動作成したフレーズ対に人手で作成した翻訳対を追加する ことを考えた.

人手で作成された約13万の翻訳対に翻訳確率を与え,プログラムで自動作成したフ レーズテーブルに追加した結果,BLEUスコアの値が,日英翻訳の単文は0.9$%$, 重文複文では0.8$%$向上した.また,英日翻訳では単文は1$%$,重文複文は 2.5$%$向上した.結果から,人手で作成した翻訳対を追加した提案手法は有効 であることが示された.



平成21年3月17日