next up previous contents
次へ: 関連する既存のプログラム 上へ: 研究の背景 戻る: 研究の背景   目次

文型パターン

文型パターンは,日英文対応の対訳コーパスから作成される.原文は,単語レベ ル,句レベル,節レベルの3レベルにパターン化され,各レベルに応じた粒度で アライメントがとれた部分は,線形要素として変数化される.逆に,変数化すると 対訳の訳出が困難になる部分は変数化せず,非線形要素として字面,あるいは関 数の形式で残される.

文型パターンの具体例を以下に示す.
$\bullet$日本語原文=彼は不幸にも金をなくした。
$\bullet$英語原文=He had the misfortune to lose his money.
$\bullet$日本語パターン =$N1$は不幸にも$N2$$V3.kako$
$\bullet$英語パターン =$N1$ had the misfortune to $V3$ $N1$.$poss$ $N2$.

$N$は名詞,$V$は動詞,$.kako$は時制を表している.英語パターンは日本語パターン を元に,英語原文を変数化して作成されている.

本稿では[1]の文型パターン辞書を用いて,記述子を適切に処理し, 英文を生成する翻訳実験システムを実装する.



平成18年5月30日