翻訳確率の問題点

提案手法の誤り解析から翻訳確率の問題点を考察する.


5.3.1.1 誤出力の結果

解析する提案手法の誤出力の結果を表5.13に示す.また,翻訳確率を表5.14に示す.この出力結果は複数作成された出力候補文の中で翻訳確率が第1位である.


Table: 提案手法の誤出力の結果
入力文 その翌日のバスの切符を買った。
参照文 He booked himself for the following day's bus.
文パターン(日本語側) X3 X0 X4 X5 X1 X2 た。
文パターン(英語側) X3 X2 X1 X4 X0 X5 .
変換テーブル1#1(X0) C : 翌日  D : next
変換テーブル1#1(X1) C : の切符 D : ticket for
変換テーブル1#1(X2) C : を買っ D : bought a
変換テーブル1#1(X3) C : その  D : I
変換テーブル1#1(X4) C : の   D : the
変換テーブル1#1(X5) C : バス  D : bus
出力文 I bought a ticket for the next bus.


Table: 出力文の翻訳確率
出力候補文 I bought a ticket for the next bus.
134#134 -48.1586
135#135 -3.5850
136#136 -2042.5963
137#137 -2094.3399

5.13の出力文からは「翌日」を表す英語句が存在しない.また,表5.14を見ると,言語モデルの確率(136#136)が,他の2つの確率(134#134135#135)と比較して非常に小さい.

5.3.1.2 比較的正しい出力候補文の結果

比較的正しい出力候補文「I bought a ticket for bus in the next day.」が作成されていた.また,複数作成された翻訳候補文の中で翻訳確率が第3位である.文の作成結果を表5.15に示す.また,翻訳確率を表5.16に示す.


Table: 出力候補文の作成結果
文パターン(日本語側) その X2 X0 X4 X1 X3 た 。
文パターン(英語側) I X3 X1 X4 X0 the X2 .
変換テーブル1#1(X0) C : の    D : in
変換テーブル1#1(X1) C : の 切符 D : ticket for
変換テーブル1#1(X2) C : 翌日   D : next day
変換テーブル1#1(X3) C : を 買っ D : bought a
変換テーブル1#1(X4) C : バス   D : bus
出力候補文 I bought a ticket for bus in the next day.


Table: 出力候補文の翻訳確率
出力候補文 I bought a ticket for bus in the next day.
134#134 -27.9219
135#135 -3.9069
136#136 -2290.6281
137#137 -2322.4569

5.15の出力候補文は翻訳確率(137#137)が表5.13の出力文と比較して小さかったため,出力文として選択されなかった.また,126#126は比較的正しい出力候補文(表5.16)の方が,誤出力文(表5.14)より大きい.

5.3.1.3 解析

5.145.16から以下の2点が分かる.

従って,比較的正しい出力候補文を選択する方法として2つの方法がある.

  1. 別の種類の言語モデルを使用する.
  2. 126#126131#131127#127に重みを付ける.