次へ:
テストデータ
上へ:
実験データ
戻る:
英辞郎
目次
学習データ
単文の実験では,学習データとして,辞書から抽出した単文の対訳文100,000文対を用いる.また,重文複文の実験では,学習データとして,辞書から抽出した重文複文の対訳文100,000文対を用いる.なお,単文,重文複文それぞれの対訳文には,統計翻訳の前処理として,日本語文にはchasenを用いて形態素解析を行い,英語文に対しては,句読点の前後にスペースを入れる.前処理を行った学習データの例を表
4.2
に示す.
表 4.2:
学習データの例
私 は 映画 を 見 に 行く 。
I go to see a movie .
心 は 経験 によって 育つ 。
The mind expands with experience .
あの 人 の 家 は すぐ 見つかっ た 。
I soon found that person's house .
平成22年2月13日