next up previous contents
次へ: テストデータ 上へ: 実験データ 戻る: 英辞郎   目次

学習データ

単文の実験では,学習データとして,辞書から抽出した単文の対訳文100,000文対を用いる.また,重文複文の実験では,学習データとして,辞書から抽出した重文複文の対訳文100,000文対を用いる.なお,単文,重文複文それぞれの対訳文には,統計翻訳の前処理として,日本語文にはchasenを用いて形態素解析を行い,英語文に対しては,句読点の前後にスペースを入れる.前処理を行った学習データの例を表4.2に示す.

表 4.2: 学習データの例
私 は 映画 を 見 に 行く 。
I go to see a movie .
心 は 経験 によって 育つ 。
The mind expands with experience .
あの 人 の 家 は すぐ 見つかっ た 。
I soon found that person's house .



平成22年2月13日