next up previous contents
次へ: パターンに基づく統計翻訳システム 上へ: パターン翻訳システム 戻る: 文パターンの選択   目次

文生成

対訳句を用いて文パターンの変数に適合する局所的な要素の翻訳を行う. 通常日本語の要素を英語に翻訳する場合,同一の意味の表現が多数ある.また,関数による制約がない場合,活用形の表現もさまざまである.従って,日本語要素の翻訳は,変数や関数の制約による絞り込みを行い,それでもなお複数の表現や活用形がある場合,それ以上の絞り込みは行わずに対訳句を英語文パターンに代入する.これらを翻訳文の候補とする.

次に翻訳文の候補より尤もらしい候補を選択する.翻訳候補の選択には$ N$ -gramモデルを用いる.まず英語文パターンをワードグラフに変換し,ワードグラフの隣接する候補の連鎖確率を求める. 日本語入力文``彼は車を持っている。",英語文パターン``$ <$ He$ \vert N1>$ $ V3\verb\vert^\vert present$ (a$ \vert$ an) $ N2$ .",変数``$ N1$ =彼,$ N2$ =車,$ V3$ =持っ"である場合のワードグラフを図2.10に示す.図2.10において,太線は連鎖確率が高いつながりを表している.

図: ワードグラフの例
\fbox{
\includegraphics[scale=0.7]{word_graph.eps}
}



平成27年3月13日