問題点

従来手法の問題点は, 出力文中の未知語の翻訳は行われておらず, 入力文中における未知語に相当する部分の意味が読み取れない点である. 出力文中の未知語が翻訳されていない例を表2.15に示す.


表: 未知語が翻訳されていない例
入力文 彼 は 麻薬 所持 の 疑い で 検挙 さ れ た 。
参照文 He was arrested for having drugs .
出力文 He was arrested on suspicion of 麻薬 所持 .

上記のような出力がされる流れを以下に示す.

  1. 2.15の入力文に対して表2.16の文パターンが適応される.


    表: 適応された文パターン
    日本語側 彼 は X1 の 疑い で X2 さ れ た 。
    英語側 He was X2 on suspicion of X1 .

  2. 2.17の学習文対を表2.16の文パターンにしたがって変換し, 学習文対に一致させる.


    表: 変換する学習文対
    日本語側 彼 は 詐欺 の 疑い で 逮捕 さ れ た 。
    英語側 He was arrested on suspicion of fraud .

  3. X1 に変換テーブル表2.18を適用し, 学習文対と入力文の日本語側を一致させる.


    表: X1に適用される変換テーブル
    A 逮捕 B arrested
    C 検挙 D arrested

  4. X2に変換テーブルを適用する. この際, 変換テーブルのAにあたる「詐欺」とCにあたる「麻薬所持」を持つ変換テーブルが存在しない. よって, 未知語出力用変換テーブル表2.19を適用し, 学習文対と入力文の日本語側を一致させる.

    表: X2に適用される変換テーブル
    A 詐欺 B fraud
    C 麻薬所持 C 麻薬所持

以上により, 出力文中の未知語が翻訳されずに出力される.