next up previous contents
次へ: 文型パターンの照合 上へ: 文型パターン辞書 戻る: 任意要素指定機能   目次

文型パターン辞書

文型パターン辞書は,日本語の基本的な表現が収録されていると見られる辞書や, 語学教育用の教科書,機械翻訳機能評価用の試験文等,約30種類のドキュメント (日英対訳文100万件)から,2箇所,又は3箇所の述部を持つ日本語の重文 (文接続のある文),複文(埋め込み文のある文)の対訳標本文約12.9万件を取 り出し,それを汎化することによって作成されており,汎化の程度により, 単語レベル,句レベル,節レベルの3種類の文型パターン(異なり文型パターン 22.1万件)が収録されている.
    単語レベルの文型パターン辞書(異なり文型パターン12.3万件)では,原 文任意要素が約70万回挿入されて おり,1文型パターンあたり,平均6箇所に離散記号が挿入されている.また, 文型任意要素は約4万回挿入されており,1文型パターンあたり,平均0.3回文 型任意要素記号が挿入されている.



平成17年3月23日