自動対訳句

自動対訳句の作成手順[20]を以下に示す.

手順1
対訳文とGIZA++を利用して単語辞書を 作成する.
手順2
対訳文と作成した単語辞書を用いて単語レベル文パターンを作成する.
手順3
対訳文と単語レベル文パターンを用いて,対訳句を作成する.

実験において得られた自動対訳句の内訳を表6.5に示す.


表: 自動対訳句の内訳
  日本語 英語
句数 26,757句
単語数 127,931語 106,224語
異なり単語数 15,459語 12,976語
平均句長 4.78語 3.97語

また,6.1節と同様に, 全ての自動対訳句から無作為に100対を抽出し,それぞれの対応の適切さを人手により評価した. 評価結果を表6.6に,評価例を表6.7に示す.



表: 自動対訳句の評価結果
×
36句 44句 20句


表: 自動対訳句の評価例
評価 対訳句例
容赦 の ない 残忍 さ remorseless brutality
  食事 の 用意 を し preparing the meals
  同じ 道 same path
の 痛み が 和らい pain from the
  はしご を 掛け a ladder
  フラスコ flask and heat
× 入り て Ogata
  の 卑しい him in birth
  で 給水 の on its

人手対訳句と自動対訳句の精度の比較では, 自動対訳句の精度は適切な対応をとる句が100句中36句となり,適切な対応をとる句が100句中86句である人手対訳句と比較して,低くなっていることが確認できる.