問題点

従来手法の問題点は,入力文に対するカバー率が低いことである. 出力不可能な例として表2.152.16があげられる.


Table: 出力不可能な例
入力文 その数値は小さくなった。
一致させたい学習文対(日本語側) その振幅は大きくなった。
一致させたい学習文対文対(英語側) The amplitude increased.
想定する出力文 The value was small.


Table: 用意されている変換テーブル
  A B C D
変換テーブル1 振幅 amplitude 数値 value
変換テーブル2 大きくな increased 走る run
変換テーブル3 大きくな grow 小さくな was small

上記の例が出力不可能となる流れを説明する.

  1. 変換テーブル1を適用し入力文中の「数値」を「振幅」に変換する.
  2. 変換テーブル2は「C : 走る」が学習文対の日本語側に存在しない.
  3. 変換テーブル3は「B : grow」が学習文対の英語側に存在しない.

以上より,示した例は出力不可能である. 本稿では,この問題を解決するために新しい手法を提案する.