実験データ

本研究では,学習文対および翻訳実験に用いる入力文として, 電子辞書などの例文より抽出した単文データを用いる[19].
 RSMTの候補文はOpen-NMTの第1候補を用いる. また,使用するOpen-NMTのモデル数は32個である. よって候補文は,入力文1文につき32文存在する. 使用するデータの内訳を表5.1に示す.
Table: 実験データ
学習文対 160,000文対
入力文(自動評価用) 1,000文
候補文(自動評価用) 32,000文
入力文(人手評価用) 100文
候補文(人手評価用) 3,200文

学習文対および,入力文の例を表5.2と表5.3に示す.


Table: 学習文対の例
学習文対
日本語原文 英語原文
あいつは甘えている。 He is spoiled.
あの小川で釣りをしよう。 Let's fish the creek.
いつかは石油資源が枯渇する。 Oil resources will dry up someday.


Table: 入力文の例
入力文
日本語文 参照文
花は太陽の方に傾く。 Flowers bend toward the sun.
彼らの間に不満が増大した。 Discontent waxed among them.
彼はすぐ帰国の途につく。 He will soon start for home.