next up previous contents
次へ: 重文複文コーパス 上へ: 実験データ 戻る: 実験データ   目次

単文コーパス

単文コーパス[12]は,日本語が単文である対訳コーパスである. コーパスの文は辞書の例文から抽出している.本実験では学習データとして100,000文, ディベロップメントデータとして1,000文を用いる. 日英翻訳にはテスト文として3,744文,英日翻訳にはテスト文として1,122文を用いる. 単文コーパスの例を表[*]に示す.


=1pt
表: 単文コーパスの例
日本語文 コンピューター は 2 進 法 の 2つ の 数 を 用いる 。
英語文 A computer employs the two digits of the binary system .
日本語文 彼 の 姿 は 暗闇 の 中 で 見え なかっ た 。
英語文 He was hidden by the darkness .
日本語文 その ビル は 倒壊 の 危険 が ある 。
英語文 The building is in danger of collapsing .



平成26年3月10日