next up previous contents
次へ: 1) 学習データ 上へ: 実験環境 戻る: 実験環境   目次

実験データ

統計翻訳の前処理として,実験データの日本語文に対して,MeCab[19]を用いて分かち書きを行う.また,実験データの英語文に対して,tokenizer.perl[20]を用いて分かち書きを行う.主語補完を行う際の形態素解析には,CaboCha[21]を用いる.本実験で用いる実験データの詳細を以下に示す.

Subsections

平成25年2月13日