学習文対(日本語) | 私はペンを取る。 |
学習文対(英語) | I take the pen. |
単語レベル文パターン(日本語) | 126#126は127#127を2#2。 |
単語レベル文パターン(英語) | 126#126 2#2 127#127 . |
学習文対(日本語) | 彼はそれを取る。 |
学習文対(英語) | He takes it. |
単語レベル文パターン(日本語) | 126#126は127#127を2#2。 |
単語レベル文パターン(英語) | 126#126 2#2 127#127 . |
また,表5.6,表5.7に2つの学習文対の対訳句と対訳単語確率の例を示す.
対訳句の変数 | 日本語句 | 英語句 | 1#1 | 3#3 |
126#126 | 私 | I | 0.4 | 1.1 |
2#2 | 取る | take | 0.6 | 0.9 |
127#127 | ペン | the pen | 0.5 | 1.0 |
対訳句の変数 | 日本語句 | 英語句 | 1#1 | 3#3 |
126#126 | 彼 | He | 0.4 | 1.1 |
2#2 | 取る | takes | 0.5 | 1.0 |
127#127 | それ | it | 0.6 | 0.9 |
表5.4,表5.5は単語レベル文パターンが一致している.また,2#2について日本語句「取る」に対して異なる英語句を用いて表現されている.この2つの対訳句を 3#3の値が高い順番で順位を決定し,順位が128#128位以下の対訳句を削除する.ここでは128#128=2とする.それぞれの変数確率とその順位を表5.8に示す.
対訳句「取る」「take」は 1#1を用いた順位では1位となるが, 3#3を用いた順位では2位となり削除される. 一方で,対訳句「取る」「takes」は 1#1を用いた順位では2位であるが, 3#3を用いた順位では1位となる. このように提案手法を用いることで,より正しい対訳句が削除される場合がある.