Next:
Neural Machine Translation
Up:
相対的意味論に基づく変換主導統計機械翻訳(TDSMT)[1]
Previous:
翻訳の手順
目次
問題点
従来手法の問題点は, 出力文中の未知語の翻訳は行われておらず, 入力文中における未知語に相当する部分の意味が読み取れない点である. 出力文中の未知語が翻訳されていない例を表
2.15
に示す.
表:
未知語が翻訳されていない例
入力文
彼 は 麻薬 所持 の 疑い で 検挙 さ れ た 。
参照文
He was arrested for having drugs .
出力文
He was arrested on suspicion of
麻薬 所持
.
上記のような出力がされる流れを以下に示す.
表
2.15
の入力文に対して表
2.16
の文パターンが適応される.
表:
適応された文パターン
日本語側
彼 は
X1
の 疑い で
X2
さ れ た 。
英語側
He was
X2
on suspicion of
X1
.
表
2.17
の学習文対を表
2.16
の文パターンにしたがって変換し, 学習文対に一致させる.
表:
変換する学習文対
日本語側
彼 は 詐欺 の 疑い で 逮捕 さ れ た 。
英語側
He was arrested on suspicion of fraud .
X1
に変換テーブル表
2.18
を適用し, 学習文対と入力文の日本語側を一致させる.
表:
X1
に適用される変換テーブル
A
逮捕
B
arrested
C
検挙
D
arrested
X2
に変換テーブルを適用する. この際, 変換テーブルの
A
にあたる「詐欺」と
C
にあたる「麻薬所持」を持つ変換テーブルが存在しない. よって, 未知語出力用変換テーブル表
2.19
を適用し, 学習文対と入力文の日本語側を一致させる.
表:
X2
に適用される変換テーブル
A
詐欺
B
fraud
C
麻薬所持
C
麻薬所持
以上により, 出力文中の未知語が翻訳されずに出力される.
Next:
Neural Machine Translation
Up:
相対的意味論に基づく変換主導統計機械翻訳(TDSMT)[1]
Previous:
翻訳の手順
目次