次へ: ベースラインシステム
上へ: 実験条件
戻る: 単文データ
目次
tri-gram学習データ
tri-gram学習データには英日対訳学習文100,000文を使用する.翻訳文のtri-gramスコア()に閾値を設け,翻訳文を分類する.翻訳文は
- -1,000 0
- -2,000 -1,000
- -3,000 -2,000
- -3,000
の4つに分類する.
また,以下の場合は翻訳結果を出力しない.
- 入力文が英語文パターンに一致しない
- 5.3節の手順2において変数部に対応する単語が英日対訳単語辞書に登録されていない
eki takashi
平成24年3月13日