次へ: 1) 学習データ 上へ: 実験環境 戻る: 実験環境目次

実験データ

統計翻訳の前処理として，実験データの日本語文に対して，MeCab[19]を用いて分かち書きを行う．また，実験データの英語文に対して，tokenizer.perl[20]を用いて分かち書きを行う．主語補完を行う際の形態素解析には，CaboCha[21]を用いる．本実験で用いる実験データの詳細を以下に示す．

Subsections

1) 学習データ
2) テストデータ
3) ディベロップメントデータ

平成25年2月13日