次へ: 日英統計翻訳システム 上へ: honron 戻る: 表一覧目次

はじめに

機械翻訳は，人手によって翻訳ルールを記述し，翻訳を行うルールベース翻訳が用いられていた．しかし，ルールベース翻訳は，人手で翻訳ルールを記述することに大きなコストがかかる．また，多言語間で翻訳を行う場合，言語間ごとに翻訳ルールを記述する必要があり，多言語化が困難であるという問題点があった．そこで，近年の機械翻訳では，対訳データから自動的に機械翻訳システムを構築する統計翻訳が主流となっている．統計翻訳は，対訳データがあれば，自動的に翻訳規則を作成できるため，コストが小さく，また多言語化も容易に行うことができる．
この統計翻訳において，様々な問題点がある．その問題点の一つとして，主語が省略されている日本語文の日英翻訳が挙げられる．日本語において，主語が省略されている日本語文が多く存在する．猪澤ら[1]は，この主語が省略されている日本語文の日英翻訳は，翻訳精度が低いということを報告している．しかし，統計翻訳において，主語が省略されている日本語文に主語を付与し，解析を行っている実験は見られない．
そこで本研究では，統計翻訳を行う前に，主語が省略されている日本語文に対して主語を付与する(主語補完と呼ぶ)．この主語補完による翻訳精度を調査し，主語補完の有効性を確認する．調査の結果，主語補完を行わない翻訳と比較し，主語補完を行った翻訳では，単語対応の改善が見られ，翻訳精度が向上した．この調査結果より，主語補完の有効性が確認できた．
2章において，日英統計翻訳システムについての説明を行う．3章において，主語が省略されている文において述べている研究と，主語補完を行っている研究について述べる．4章において，主語が省略されている文の定義を行う．5章において，主語補完方法を説明する．6章において，行った実験の種類と，実験の流れを説明する．7章において，実験環境についての説明を行う．8章において，実験の評価方法について説明する．9章において，主語補完の有効性を述べる．10章において，解析および考察を行う．12章において，結論を述べる．

平成23年4月12日