先行研究では,対訳フレーズ対に翻訳確率を付与し,フレーズテーブルに追加する. 通常,フレーズテーブルを作成するためのパラメータにはgrow-diag-finalを使用する. しかし,grow-diag-finalで作成されるフレーズ対は,長いフレーズ対を短いフレーズ対に分割する.長いフレーズ対が短く分割されてしまうと,長い翻訳対に対して,翻訳確率を付与することができないという問題がある.
そこで,長い翻訳対に対して翻訳確率を付与するために,パラメータintersectionで作成したフレーズテーブルのフレーズ対と対訳フレーズ対のマッチングを行う.フレーズ対と対訳フレーズ対が完全に一致した場合にのみ対訳フレーズ対にフレーズテーブルで算出された翻訳確率を付与する. そして,パラメータgrow-diag-finalで作成したフレーズテーブルに,翻訳確率を付与した対訳フレーズ対を追加する.
先行研究の手法を以下に示す.
あらゆる ![]() ![]() |
あらゆる ![]() ![]() |
いつ ![]() ![]() |
いつも ![]() ![]() |
いつも ![]() ![]() |
いつも の ![]() ![]() |
いつも の ![]() ![]() |
いつも の よう に ![]() ![]() |
いつも の よう に ![]() ![]() |
対訳フレーズ対の日本語フレーズと英語フレーズがintersectionで作成したフレーズテーブルのフレーズと一致した場合に,その翻訳確率を対訳フレーズ対に付与する.
たとえば,表3.3の2行目``あらゆる every
''に翻訳確率を付与する場合,表3.2の``あらゆる
every
0.028 0.0215 0.2888 0.1340 ''1行目の日本語フレーズと英語フレーズと一致する.
よって,対訳フレーズ対``あらゆる
every
''に翻訳確率``0.028 0.0215 0.2888 0.134''を付与する.
他の対訳フレーズ対に対しても同様にして翻訳確率を付与する.
あまりに ![]() ![]() |
あらゆる 場合 に ![]() ![]() |
あらゆる 点 で ![]() ![]() |
あらゆる ![]() ![]() |
いつ ![]() ![]() |
いつも ![]() ![]() |
いつも の よう に ![]() ![]() |
3.1節の手順1のフレーズテーブルを用いた翻訳を先行研究のベースラインとする. また,人手で作成された対訳フレーズ辞書として鳥バンクを用いた先行研究手法を先行研究(鳥バンク)と呼び,英辞郎を用いた先行研究手法を先行研究(英辞郎)と呼ぶ.