次へ:
1) 学習データ
上へ:
実験環境
戻る:
実験環境
目次
実験データ
統計翻訳の前処理として,実験データの日本語文に対して,MeCab[
19
]を用いて分かち書きを行う.また,実験データの英語文に対して,tokenizer.perl[
20
]を用いて分かち書きを行う.主語補完を行う際の形態素解析には,CaboCha[
21
]を用いる.本実験で用いる実験データの詳細を以下に示す.
Subsections
1) 学習データ
2) テストデータ
3) ディベロップメントデータ
平成25年2月13日