日英機械翻訳の分野において,重文・複文の日英機械翻訳のために文型パター ン辞書が構築されている.これまでの開発で重視された点は,文型パターン辞書 の被覆率の確保であり,文型パターン辞書を用いた翻訳は未着手であった.そ のため,この文型パターン辞書を使用した翻訳方式の発展が期待されている.
この文型パターン辞書を用いた翻訳は,最初に英語文の構造を決定するため 英文全体の構造をおおまかに保つ利点を持つ.しかし,記述子の局所的な翻訳結 果は非決定的であり,英文の表現生成をするためには,翻訳結果の選択を行う必 要がある.これに対し,他の日英機械 翻訳方式である統計翻訳は,日英の言語モデルを用いて部分翻訳の候補の中から 確率による選択を行い,尤もらしい英文を生成できる特徴を持つ.
そこで本研究では,英文の表現生成を実現するために,統計翻訳の特徴に着目し, 日英パターン翻訳方式として,以下の手順を提案する.まず英語文の構造を英語 パターンにより決定して,記述子の局所的な翻訳結果を候補として非決定的に英 語パターンに代入し,確率により候補の選択を行い英語文を生成する.次に,こ の翻訳方式に基づき実装を行い,実装したシステムの評価実験をする.評価実験 では,(1)記述子処理の正確性,(2)英語原文の復元の可能性,(3)出力英文の意 味的な正しさ,を評価する.
以上の結果,(1)は,品詞変換関数以外はほぼ正確に処理できた.
(2)は,原文を復元できたのは約10%であった.復元できなかった原因は,辞書
引きの失敗,尤度による選択や英語パターンの表記が問題であった.しかし,
(3)のクローズドテストの結果によると,意味的・統語的に正しいものが約50%を
占め,さらに,統語的に誤りがあるが意味的には正しいものが約40%を占めたこ
とにより,英語原文と全く同じ英文を生成できなくても,意味的に正しい英文を
生成でき,本提案方式の基本的な可能性を確認できたと言える.