next up previous contents
次へ: 評価パラメータの種類 上へ: 被覆率調査における評価パラメータ 戻る: 被覆率調査における評価パラメータ   目次

文型パターン

文型パターンは,日英文対応の対訳コーパスから作成される.原文は,単語レベ ル,句レベル,節レベルの3レベルにパターン化され,各レベルに応じた粒度で アライメントがとれた部分は,線形要素として変数化される.逆に,変数化すると 対訳の訳出が困難になる部分は変数化せず,非線形要素として字面,あるいは関 数の形式で残される.

文型パターンの具体例を以下に示す.
$\bullet$日本語原文=彼は不幸にも金をなくした。
$\bullet$英語原文=He had the misfortune to lose his money.
$\bullet$日本語パターン =$N1$は不幸にも$N2$$V3.kako$
$\bullet$英語パターン =$N1$ had the misfortune to $V3$ $N1$.poss $N2$.

$N$は名詞,$V$は動詞,$.kako$は時制を表している.英語パターンは日本語パターン を元に,英語原文を変数化して作成されている.

本稿では,[1]の文型パターンのうち文法・単語レベルの文型パターン辞書(122,619 パターン)を「基準パターン辞書」とする.この辞書を対象に汎化・無効化を行い,新たなパ ターン辞書「対象パターン辞書」を作成する.


平成17年3月22日