next up previous contents
次へ: 統計的階層句機械翻訳 上へ: 統語的タグを用いた統計的階層句機械翻訳 戻る: 統語的タグを用いた統計的階層句機械翻訳   目次

背景と目的

従来の統計翻訳では,翻訳過程において統語的情報を用いていない.そのため,日本語と英語のような言語構造が大きく異なる 言語間の翻訳において高い翻訳精度が得られない場合が多い.この問題に対して,様々な研究が行われている.

大西らは,文書レベルの文脈情報を用いてフレーズの並び替えを制限する手法を提案し,有意な成果を得た[3].また,Zollmannらは統語的情報を用いた機械翻訳システムを提案し,公開している[4].しかし,統語的情報を用いた機械翻訳の問題点として,統語ラベルの爆発的増加による,解析および翻訳時間の増加が挙げられる.

そこで,本研究では,日英統計的階層句機械翻訳において,`浅い'統語的情報を用いる手法を提案する.浅い統語的情報として,日本語文の名詞句と動詞句にタグを付与する.タグを付与した日本語文を用いて学習することで,統語的情報を含む文法規則が生成され,翻訳精度が向上すると考えられる.



平成25年2月12日