next up previous contents
次へ: 各タイプの比較 上へ: 考察 戻る: 考察   目次

プログラムで自動的に作成した対訳パターンと, 人手で作成した対訳パターンの比較

プログラムで自動的に作成した対訳パターンと, 人手で作成した対訳パターンを追加する手法で, 同じ手法の翻訳結果で比較する. タイプが似ている,プログラムで自動的に作成した対訳パターンを追加する手法と, 人手で作成した対訳パターンを追加する手法を用いる. まず, 表7.1にプログラムで自動的に作成した対訳パターンを用いた手法と, 人手で作成した対訳パターンを用いた手法の対比較評価した結果を示す. 比較する文は各翻訳結果10,000文からランダムで100文を選ぶ.


表: 自動作成対訳パターンと人手作成対訳パターンの対比較評価
日英翻訳
  +自動作成・タイプA○ +人手作成・タイプA○ 差なし 同一出力
PSMT 5 1 88 6
HSMT 3 1 91 5
  +自動作成・タイプA○ +人手作成・タイプB○ 差なし 同一出力
PSMT 3 1 86 10
HSMT 2 0 91 7
英日翻訳
  +自動作成・タイプA○ +人手作成・タイプA○ 差なし 同一出力
PSMT 6 1 87 6
HSMT 3 1 89 7
  +自動作成・タイプA○ +人手作成・タイプB○ 差なし 同一出力
PSMT 7 2 85 6
HSMT 6 3 83 8

6章で,プログラムで自動的に作成した対訳パターンと, 人手で作成した対訳パターンを使用した手法を用いた. 日英翻訳での自動評価,人手評価ともに, プログラムで自動的に作成した対訳パターンを用いた手法と, 人手で作成した対訳パターン用いた手法に翻訳精度の差が確認できなかった. この原因は, 7.1で述べた原因によるものが考えられる.

英日翻訳ではPSMTを用いて行った自動評価の結果と, PSMTとHSMTの両方の人手評価の結果から, 明らかにプログラムで自動的に作成した対訳パターンを用いた手法が翻訳精度の向上において良いことが示された. 人手で作成した対訳パターンは, アナリストによって作られたため, 変数化に完全性がある. 一方, プログラムで自動的に作成した対訳パターンは, ALTの日英対訳辞書を用いて日本語単語に対応する英語単語を見つける. 対訳辞書によって対応関係が決定できた単語を日英同一の変数に置き換える. 変数に置き換えられた順番に変数に番号を付ける. そのため, 本来, 変数化したい品詞が変数化されていない. つまり, 完全性に乏しい. 例を表7.2に示す.


表: 変数化の完全性がわかる例
日本語文 グラス が 手 から 滑り落ち て 割れ た 。
英語文 The glass slipped from my hand and smashed .
自動作成 N1 が N2 から 滑り落ち て 割れ た 。
  The N1 slipped from my N2 and smashed .
人手作成 N1 が N2 から V3 て V4 。
  N1 V3 from N2 and V4 .

しかし, 人手で作成した対訳パターンを用いた手法が, プログラムで自動的に作成した対訳パターンを用いた手法よりも翻訳精度が向上しなかった. 原因としては, 人手で作成した対訳パターンは, 本研究のために作られたわけではないので, プログラムで自動的に作成した対訳パターンよりも変数化を図っている点である. 動詞は文を構成する上でも重要で, 統計翻訳においても同様に重要あることが報告されている. 5.6.2の表5.7にあるようにBe動詞(is,was)を``@be''と変数化を行っている. この変数化が汎化してしまっている. 結果として, 翻訳精度はプログラムで自動的に作成した対訳パターンを用いた手法が高くなったのだと考える.


next up previous contents
次へ: 各タイプの比較 上へ: 考察 戻る: 考察   目次
平成26年3月7日