今回の実験では,TDSMTの手法のおおまかな理論,考え方を示すため,確率値の詳しい計算には触れていない.しかし,変換テーブルの適用確率の計算方法や,利用する言語モデルの選択など今後詳しく調査する必要がある.
変換テーブルの適用確率は単純に「AがB」の部分の単語翻訳確率と,「CがD」の部分の単語翻訳確率を掛けあわしている.「AがB」と「CがD」の関連性を示す指標は利用していない.そのため,変換テーブルの適用確率が適切でない問題がある.今後,「AがB」と「CがD」の関連性を示す確率値を考案したい.
出力文の決定の際,翻訳候補文の言語モデルの確率値と変換テーブルの適用確率値を単純に掛けあわせた確率をもとに順位をつけている.しかし,言語モデルの確率値は変換テーブルの適用確率値と比較して,非常に小さい.この場合,2つの確率値を出力文の決定に利用しているが,言語モデルの確率値によってほぼ決定してしまう.このように,出力文の決定に2つの確率値をうまく利用する手法を考案する必要がある.
また,単純に順位づけするだけでは,高順位のものがほぼ同じ翻訳候補文があつまり,考察がうまくできない.出力文の決定方法にはまだまだ改善点があると考えられる.