次へ:
対訳学習文
上へ:
実験データ・実験環境
戻る:
実験データ・実験環境
目次
実験データ
一般に,日英統計翻訳では前処理として,日本語文を形態素解析を用いて単語に区切る.本研究では,形態素解析器としてMeCab[
11
]を用いる.また,英語文に対して句読点の前後にスペースを入れる.この処理を対訳学習文,テスト文それぞれに行う.
Subsections
対訳学習文
テスト文
確率を付与した翻訳対
平成24年3月23日