next up previous contents
次へ: 評価方法 上へ: 実験環境 戻る: ハイブリッド翻訳   目次

実験データ

実験には,辞書の例文より抽出した単文コーパス[6]から 表[*]に示す文数を使用する.


=23pt
表: 実験に使用する文
日本語学習文 100,000文
英語学習文 100,000文
テスト文 10,000文
ディベロップメント文 1,000文

また統計翻訳の前処理として,日本語文に対し,``Mecab[10]"を使用し, 形態素解析を行う.また,英語文に対し,``tokenizer.perl[8]"を使用し, 分かち書きを行う.表6.2に単文コーパスの例を示す.


=23pt
表: 単文コーパスの例
日本語文 私 は 家 の 外 に 出 た 。
英語文 I went outside the house .
日本語文 私 は 山 に 登っ た 。
英語文 I climbed a mountain .
日本語文 私 は 雷 を 恐れる 。
英語文 I have a horror of thunder .



平成25年2月12日