1#1を用いた対訳句の削除

対訳句の順位付けは対訳単語確率によって行い,順位が低い対訳句を削除する.従来手法では,自分自身の対訳単語確率( 1#1)によって選択する. 1#1の値が高い順番で順位を決定し,順位が128#128位以下であれば削除する.ここでは128#128=3とし,3位以下の対訳句を削除する.
 例として表2.13,表2.14,表2.15に3つの学習文対と単語レベル文パターンを示す.表2.13は表2.11と同じ学習文対である.


表: 学習文対と単語レベル文パターンの例1
学習文対(日本語) 彼は彼女が好きだ。
学習文対(英語) He likes her.
単語レベル文パターン(日本語) 126#126127#1272#2だ。
単語レベル文パターン(英語) 126#126 2#2 127#127 .


表: 学習文対と単語レベル文パターンの例2
学習文対(日本語) 彼はゴルフが好きだ。
学習文対(英語) He is keen on golf.
単語レベル文パターン(日本語) 126#126127#1272#2だ。
単語レベル文パターン(英語) 126#126 2#2 127#127 .


表: 学習文対と単語レベル文パターンの例3
学習文対(日本語) 彼はギャンブルが好きだ。
学習文対(英語) He is so into gambling.
単語レベル文パターン(日本語) 126#126127#1272#2だ。
単語レベル文パターン(英語) 126#126 2#2 127#127 .

また,表2.16,表2.17,表2.18に3つの学習文対の対訳句と対訳単語確率の例を示す.


表: 対訳句と変数確率の例1
対訳句の変数 日本語句 英語句 1#1
126#126 He 0.4
2#2 好き likes 0.5
127#127 彼女 her 0.6


表: 対訳句と変数確率の例2
対訳句の変数 日本語句 英語句 1#1
126#126 He 0.4
2#2 好き is keen on 0.3
127#127 ゴルフ golf 0.7


表: 対訳句と変数確率の例3
対訳句の変数 日本語句 英語句 1#1
126#126 He 0.4
2#2 好き is so into 0.4
127#127 ギャンブル gambling 0.5

2.16,表2.17,表2.18はいずれも単語レベル文パターンが一致している.また,X1 について日本語句「好き」に対して異なる英語句を用いて表現されている.そこで,この3つの対訳句を 1#1の値が高い順番で順位を決定し,順位が低い対訳句を削除する.それぞれの変数確率とその順位を表2.19に示す.


表: 各学習文対の対訳句2#2の変数確率とその順位1
日本語句 英語句 1#1 1#1の順位
好き likes 0.5 1
好き is keen on 0.3 3
好き is so into 0.4 2

順位が3位以下の対訳句を削除するので,日本語句「好き」,英語句「is keen on」の対訳句を削除する.