誤った変換テーブルについて

提案手法の誤り解析から誤った変換テーブルの問題点を考察する.

5.3.2.1 誤出力の結果

解析する提案手法の誤出力の結果を表5.17に示す.


Table: 提案手法の誤出力の結果
入力文 雨の日が続いた。
参照文 He booked himself for the following day's bus.
文パターン(日本語側) X2 X0 X1X3 た。
文パターン(英語側) X2 has X3 X0 X1.
変換テーブル1#1(X0) C : の  D : in the
変換テーブル1#1(X1) C : 日 D : day
変換テーブル1#1(X2) C : 雨 D : It
変換テーブル1#1(X3) C : 続い  D : been
出力文 It has been in the day.

5.17の出力文からは「雨」を表す英語句が存在しない.また,変換テーブル1#1(X2)を見ると,明らかにCDの意味が異なっている.

5.3.2.2 誤った変換テーブルの作成例

5.17の下線部の変換テーブルが作成された手順を表5.18に示す.


Table: 誤った変換テーブルの作成手順
学習文対(日本語側) 物価が上がる。
学習文対(英語側) Prices rise.
単語レベル文パターン(日本語側) X1X0
単語レベル文パターン(英語側) X1 N0 .
照合する学習文対(日本語側) 雨が激しく降る。
照合する学習文対(英語側) It rains violently.
変換テーブル(X0) A:上がる B:rise
  C:激しく降る D:rains violently
変換テーブル(X1) A:物価 B:Price
  C:雨 D:It

下線部の変換テーブルX1が誤った変換テーブルである.なぜ,この変換テーブルが作成されたのか考察する.

5.3.2.3 解析

5.18から以下の点が分かる.

英語単語「It」は日本語文において翻訳されることが少ない.よって,変換テーブルとして抽出した際に,問題を発生させると考えられる.従って,正しい変換テーブルを作成する方法として2つの方法がある.

  1. 単語レベル文パターン作成時に「It」を変数にしない.
  2. 変換テーブル作成時に「It」を含めない.

今後,本節で考えた手法に取り組んでいきたい.