next up previous contents
次へ: 翻訳モデルの学習 上へ: 実験環境 戻る: 実験環境   目次

実験データ

実験データには,辞書の例文から抽出した日英対訳文の単文のみを用いる. 学習文には100,000文,テスト文には10,000文を用いる.また前処理として,日 本語文に対してはchasen[13]を用いて形態素解析を行い,形態素と句 読点の間にスペースを入れる.英語文に対してはコンマ,ピリオドの前後に スペースを入れる.表5.1に日英対訳文の例を示す.


表 5.1: 日英対訳文の例
日本語文 もっと 右 へ 寄っ て ください .
英語文 Please move over more to the right .
日本語文 この 傷 は 至急 手当 を せ ね ば なら ない .
英語文 The wound requires prompt treatment .



平成22年2月11日