next up previous contents
次へ: 節と句のパターン辞書 上へ: 080318 戻る: 表一覧   目次

はじめに

日英機械翻訳において,日本語の単文の場合,結合価パターンを用いる手法が有 効であることが示されている[1]. 日本語の重文複文においても結合価パターンが有効であることが期待され,約12 万件の重文複文を対象として,日英機械翻訳における重文複文の表現構造を 解析するための日英重文複文文型パターン辞書が作成された[2].

日英重文複文パターン辞書は節,句,単語の変数で構成されており,それら の3つのレベルごとにパターンが作成されている. しかし,そのうちの節や句の表現を翻訳するためのパターンは不十分であり,節 と句の表現構造を解析するためのパターン辞書はまだ作成されていない. 重文複文は複数の節から成り立ち,節は句と単語から,句は単語から成り立つと いう関係から, 句の表現構造に関する記述は日英重文複文文型パターン辞書の句レベルと単語レベルのパ ターンの中に含まれており,節の表現構造に関する記述は日英重文複文文型パターン辞書の 節レベルと句レベル,単語レベルの中に含まれていると考えられる. そこで,単語レベル,句レベル,節レベルのパターンの句変数,節変数に対応す る部分の記述を用いることで節と句のパターン辞書を作成できると考えられる.

本研究では,まず,日英重文複文文型パターン辞書から節と句に関する記述を抽出 し,節と句のパターン辞書を構築する.次に,この節と句のパターン辞書を日英 パターン翻訳システムITM[3]に実装し,日英重文複文文型パターン辞書から抽出し た日英文対100件を用いてClosedテストによる評価実験を行う.



平成20年3月21日