next up previous contents
次へ: 人手で作成された翻訳対 上へ: 実験環境 戻る: 実験環境   目次

実験データ

実験には,単文10万文,及び,日英重文複文文型パターン辞書[1]から抽出した対訳文対, 121,913文対を用いる.尚,単文10万文は,日本語が単文であり,英文は単文や複文である. 同様に日英重文複文文型パターン辞書[1]から抽出した対訳文は,日本文 が重文複文であり,英文は単文や複文である. 統計翻訳の前処理として,日本語文に対しては chasen[4]を用いて形態素解析を行う.英語文に対しては,句読点 の前後にスペースを入れる.また,大文字の小文字化を行う. 前処理を行った対訳文の例を表3.1に示す.


=0.6cm
表 3.1: 対訳文の例
単文の例
教習所 は 自動車 の 運転 法 を 教える 。
driving schools teach people how to drive a car .
彼 は 彼女 の 甘い 言葉 に 乗っ た 。
he was fooled completely by her sweet words .
若い 兵士 は 彼女 の 写真 を 胸 に 、 戦地 に 向かっ た 。
the young soldier headed for the front with her photograph at his chest .
重文複文の例
愛 と 幸せ に 満ち た 家庭 に し たい と 思い ます 。
we hope we will make our home full of love and happiness .
彼 は ときどき うなずき ながら わたし の 話 を 聞い た 。
he listened to my story nodding his head occasionally .
きみ の あいまい な 説明 で は あの 娘 が だれ だ か わから なかっ た 。
i could not recognize the girl from the vague description of her you gave me .



平成21年3月17日