next up previous contents
次へ: 目次 上へ: honron 戻る: honron   目次

概要

    等価的類推思考の原理により,重文・複文の日英翻訳のために文型パター ン辞書を構築している.この翻訳方式は,日英の対訳のとれた文を用い,日英に おいて言語表現を言い替えても意味の通る部分を,$VP$(動詞句),$NP$(名詞 句),$V$(動詞),$N$(名詞)などのように変数で表し,言い替えると意味の 通らない部分を字面で残しており,日英の両パターンを合わせて文型パターン対 としている.また,言い替え可能な要素を線形要素と呼び,言い替え不可能な要 素を非線形要素と呼ぶ.そして,変数でバインドされた部分表現ごとに翻訳を行 い,英語のパターンにそれぞれの部分表現の対訳を代入することにより,英文を 生成する.この翻訳方式を局所翻訳という.そこで,「線形要素の翻訳が,代入 された日本語だけで可能である」という仮説を立てている.しかし,部分表現ご とに翻訳することについて,一部の情報のみで英訳が生成できるのかという,局 所翻訳の可能性の程度はまだ分かっていない.
    本研究では,部分表現の中でも動詞句についての検証を行う.具体的に, 次の2点についての検証を行う.
結合価パターンの有効性の検証については,結合価パターンのみでの検証 を行うため,本研究にて,翻訳プロトタイプ「queen」を作成する.局所翻訳の 可能性の検証については,queenと,参考として,一般の翻訳ソフトである参考1 (「ALT-J/E」),参考2(「翻訳の王様」)にて検証を行う.具体的な検証方法 は次の通りである.まず,重文・複文の約12万文対の中で,日英の対訳関係 の見出された約7万件の動詞句対を対象とする.ただし,英語の動詞句を構成する 単語数ごとに分類し,その中で2単語から14単語までのものを,それぞれランダ ムで25句ずつ取り出した計325句対とする.次にこの325句対に対し,3つのシス テムでそれぞれ翻訳実験を行い,訳文の比較を行う.
    検証の結果として,局所翻訳の可能性は現段階で約70%〜76%であること が分かった.また,queenのみの結果では,再現率が89.5%,適合率が75.9%と, 結合価パターンのみを使用しただけの翻訳システムにおいては,良い結果が得ら れたと言える.よって,動詞句の翻訳に結合価パターンは有効であることが示さ れた.
    今後,queenのパターン照合条件の修正,結合価パターンに存在しない動 詞の追加,意味属性制約への柔軟な対処を行い,結合価パターンの範囲外である, 副詞についても実装し,格要素内の名詞を名詞句として認識することができれば, 更に精度があがると考えられる.



平成17年4月14日