ITMは,パターン辞書を用いて日英翻訳を行うパターン翻訳システムである.
まず,単語レベル文パターンを用いた翻訳方式を説明する.
はじめに,入力日本語文を形態素解析し,適合する日本語パターンを検索する.
日本語パターンの検索プログラムにはSPMを使用し,パターンは日英重文複文文
型パターン辞書単語レベル文パターンを用いる.次に,適合した日本語文パターン
に対応する英語文パターンを用いて,非線形要素を決定する.最後に線形要素の
変数を翻訳して,複数の翻訳候補を導き,尤度を用いて訳語を決定し,訳出する.
図2.4にシステムの構成図を示し,尤度を用いた訳出候補の選択の例
を図2.5に示す.
図2.5では,矢印の単語の流れに沿って,尤度の計算を行う.線形要素
がN1,V3,N2で,非線形要素が「with a big smile」である.
尤度計算
には2単語の共起確率から計算を行う「bi-gram」を使用する.この例では,「She」
「greeted」「me」が翻訳候補の中で最も尤度の高い組合せと判断されたため,訳出
文は「She greeted me with a big smile」となっている.
日英重文複文文 型パターン辞書の単語レベル文パターンの代わりに,句パターン辞書の単語レベ ル句パターンを用いると,文の翻訳と同様に,このシステムを用いて句の翻訳を 行うことができる.例えば,「彼のお母さん」を入力文とすると,文の入力と同 じ手順で,「his mother」が訳出される.