next up previous contents
次へ: 目次 上へ: honron 戻る: honron   目次

概要

日英機械翻訳において,提案されている方式の1つにパターン翻訳がある. パターン翻訳を行うために,大規模な重文・複文の文型パターン辞書の構築が進 められている. 日英パターン翻訳では,日本語文型パターンに適合した情報を, 英語文型パターンに引き渡し,適切な訳文を生成する. 文型パターンには,字面,変数,関数,記号の4種類の記述子が使用されている.

そこで,本稿では,翻訳実験システム実装のために,変数,関数,記号の 大きく3種類の記述子を適切に処理するプログラムを作成する. 関数41種類,記号3種類の処理を主に行う. また,作成したプログラムが正しく動作しているかの確認を行う. 具体的な確認方法として, まず,文型パターン辞書の作成に用いられた日本文からランダムに100文を選ぶ. この100文を翻訳実験システムに入力し,英文が生成されたことを確認する. 生成された英文と,入力文の対訳英文を比較し, 同じ文が生成されていることを確認する.

動作確認の結果,入力文100文中85文の生成に成功していた. 次に,生成に失敗した15文の原因について調査を行ったところ, 15文中14文は記述子の処理以外によるものであった. 記述子処理が原因の誤りは,処理の複雑な否定を含むものであった. 記述子処理以外の主な原因は,パターンの誤りであった.

記述子処理以外の原因によるものを除いた場合86文中85文の生成に 成功しており,ほぼ全ての文の生成に成功している. よって,記述子処理部は完成しているといえる.



平成18年5月30日