next up previous
次へ: 意訳とは 上へ: 重文・複文文型パターン辞書による意訳の可能性 The feasibility of 戻る: はじめに

日英パターン翻訳プロトタイプシステムITM

ITM は,文型パターン辞書の照合結果より半自動で日英翻訳を行うツールである. 文型パターン辞書は,単語,句,節の3つのレベルで分類された約22.7万件の日英文型パターン対で構成されている[1]. 日本語文と文型パターン辞書の照合は,パターン検索プログラムにより実行される[3]. パターン検索の結果として,適合する全てのパターンが得られるので, 人手で,翻訳に使用する日英パターン対,および,適合状態を指定すると,ITM がそれらを用いて英文を生成する[2]. なお,本稿では,文型パターン辞書から,単語レベル,句レベル,節レベルの順にパターンを参照し, 最初に適合したレベルの結果を使用する.

以下に入力文,日英文型パターン対,および,訳出文の例を示す.

  入力文 人は年をとると大人になる。
  (単)日パ /ytcfk$ N1$ は/tcfk年を/cf(取る$ \mid$ とる)と/tck(大人$ \mid$ おとな)に/cf(成る$ \mid$ なる)。
  (単)英パ As $ N1$ grow older, $ N1$ will grow in moderation.
  (句)日パ /ytcfk$ N1$$ VP2$$ VP3$
  (句)英パ As $ N1$ $ VP2$ , $ N1$ will $ VP3$ .
  (節)日パ /ytcfk$ CL1$ と/tck$ CL2$
  (節)英パ As $ CL1$ , $ CL2$ .
  訳出文 As you grow older, it will grow in moderation.

$ N$ , $ VP$ , $ CL$ は,それぞれ名詞,動詞句,節の変数である. これらは,線形要素と呼ばれる部分であるので, 変数に対応する日本語表現を局所的に翻訳した結果を, 英語パターンの対応箇所に挿入することができる.

/ytcfk や /cf などは,離散記号である. 各離散記号と適合する日本語要素の詳細を表[*]に示す. 現在のITMには未実装だが,離散記号処理機能が稼働すれば離散記号に適合する 部分の訳出が可能となる. 例えば,格要素に適合する記号 /c が「〜で」という日本語表現に適合した場合 に,「by 〜」,「in 〜」等の知識を用いて訳出する. これらは[1]の辞書における対訳の関係から抽出できる.


表: 各離散記号と適合する日本語要素
/y 連用節と適合
/t 連体節と適合
/c 格要素と適合
/f 連用修飾要素と適合
/k 連体修飾要素と適合


next up previous
次へ: 意訳とは 上へ: 重文・複文文型パターン辞書による意訳の可能性 The feasibility of 戻る: はじめに
平成20年1月27日