next up previous contents
次へ: 翻訳モデルの学習 上へ: 実験環境 戻る: 実験環境   目次

実験データ

実験データには,辞書の例文から抽出した日英対訳文の単文,重文複文を用いる[6].単文の翻訳実験には学習文に単文100,000文,テスト文に単文10,000文を用いる.重文複文の実験には学習文に重文複文100,000文,テスト文に重文複文10,000文を用いる.また前処理として,日本語文に対してはMeCab[14]を用いて形態素解析を行い,形態素と句読点の間にスペースを入れる.英語文に対してはコンマ,ピリオド,数字の前後にスペースを入れる.表5.1に単文の例を,表5.2に重文複文の例を示す.
表: 単文の例
日本語文 彼 は 科学 上 の 偉大 な 発見 を し た 。
英語文 He made a great scientific discovery .
日本語文 彼 は 父 の 財産 を 継い だ 。
英語文 He succeeded to his father 's fortune .
日本語文 この 中 から 1つ 取り なさい 。
英語文 Take one from among these .


表: 重文複文の例
日本語文 彼 は 父 の 後 を 継い で 医者 に なっ た 。
英語文 He followed in his father 's footsteps and became a doctor .
日本語文 彼 は 勉強 し た から 成功 し た 。
英語文 He succeeded owing to his diligence .
日本語文 これ は 法律 学 の バイブル と 言わ れる 書物 だ 。
英語文 This is called the Bible of law .



平成24年3月23日