次へ: 目次
上へ: honron
戻る: honron
目次
等価的類推思考の原理により,重文・複文の日英翻訳のために文型パター
ン辞書を構築している.この翻訳方式は,日英の対訳のとれた文を用い,日英に
おいて言語表現を言い替えても意味の通る部分を,(動詞句),(名詞
句),(動詞),(名詞)などのように変数で表し,言い替えると意味の
通らない部分を字面で残しており,日英の両パターンを合わせて文型パターン対
としている.また,言い替え可能な要素を線形要素と呼び,言い替え不可能な要
素を非線形要素と呼ぶ.そして,変数でバインドされた部分表現ごとに翻訳を行
い,英語のパターンにそれぞれの部分表現の対訳を代入することにより,英文を
生成する.この翻訳方式を局所翻訳という.そこで,「線形要素の翻訳が,代入
された日本語だけで可能である」という仮説を立てている.しかし,部分表現ご
とに翻訳することについて,一部の情報のみで英訳が生成できるのかという,局
所翻訳の可能性の程度はまだ分かっていない.
本研究では,部分表現の中でも動詞句についての検証を行う.具体的に,
次の2点についての検証を行う.
- 局所翻訳の可能性の検証
- 結合価パターンの有効性検証
結合価パターンは,単文の翻訳に有効であることが分かってい
る.単文と動詞句は良く似ており,単文の主語を除いたものを動詞句と
して見なすこともできる.そのため,本研究では結合価パターンが動詞
句の翻訳にどの程度有効であるかを検証する.
結合価パターンの有効性の検証については,結合価パターンのみでの検証
を行うため,本研究にて,翻訳プロトタイプ「queen」を作成する.局所翻訳の
可能性の検証については,queenと,参考として,一般の翻訳ソフトである参考1
(「ALT-J/E」),参考2(「翻訳の王様」)にて検証を行う.具体的な検証方法
は次の通りである.まず,重文・複文の約12万文対の中で,日英の対訳関係
の見出された約7万件の動詞句対を対象とする.ただし,英語の動詞句を構成する
単語数ごとに分類し,その中で2単語から14単語までのものを,それぞれランダ
ムで25句ずつ取り出した計325句対とする.次にこの325句対に対し,3つのシス
テムでそれぞれ翻訳実験を行い,訳文の比較を行う.
検証の結果として,局所翻訳の可能性は現段階で約70%〜76%であること
が分かった.また,queenのみの結果では,再現率が89.5%,適合率が75.9%と,
結合価パターンのみを使用しただけの翻訳システムにおいては,良い結果が得ら
れたと言える.よって,動詞句の翻訳に結合価パターンは有効であることが示さ
れた.
今後,queenのパターン照合条件の修正,結合価パターンに存在しない動
詞の追加,意味属性制約への柔軟な対処を行い,結合価パターンの範囲外である,
副詞についても実装し,格要素内の名詞を名詞句として認識することができれば,
更に精度があがると考えられる.
平成17年4月14日