next up previous contents
Next: おわりに Up: 考察 Previous: 未知語の翻訳精度に及ぼす影響   Contents

翻訳に利用する確率値について

本研究では,変換テーブルの自動作成や最終的な出力文の決定に確率値を利用している.変換テーブルの自動作成には,IBM model1(単語翻訳確率)を利用して,対訳単語を作成する.そして,IBM model1(単語翻訳確率)から変換テーブルの適用確率を計算する.また,出力文の決定にはHigh order Joint Probability(言語モデル)とIBM model1(単語翻訳確率)から計算した変換テーブルの適用確率を利用する.

今回の実験では,TDSMTの手法のおおまかな理論,考え方を示すため,確率値の詳しい計算には触れていない.しかし,変換テーブルの適用確率の計算方法や,利用する言語モデルの選択など今後詳しく調査する必要がある.

変換テーブルの適用確率は単純に「AB」の部分の単語翻訳確率と,「CD」の部分の単語翻訳確率を掛けあわしている.「AB」と「CD」の関連性を示す指標は利用していない.そのため,変換テーブルの適用確率が適切でない問題がある.今後,「AB」と「CD」の関連性を示す確率値を考案したい.

出力文の決定の際,翻訳候補文の言語モデルの確率値と変換テーブルの適用確率値を単純に掛けあわせた確率をもとに順位をつけている.しかし,言語モデルの確率値は変換テーブルの適用確率値と比較して,非常に小さい.この場合,2つの確率値を出力文の決定に利用しているが,言語モデルの確率値によってほぼ決定してしまう.このように,出力文の決定に2つの確率値をうまく利用する手法を考案する必要がある.

また,単純に順位づけするだけでは,高順位のものがほぼ同じ翻訳候補文があつまり,考察がうまくできない.出力文の決定方法にはまだまだ改善点があると考えられる.



Hiroto Yasuba 2019-05-08