next up previous contents
次へ: 評価方法 上へ: 実験環境 戻る: パラメータチューニング   目次

実験データ

実験には,辞書の例文より抽出した単文コーパス182,899文[5]から 表[*]のように用いる.
=23pt
表: 実験に使用する文
英語学習文 100,000文
日本語学習文 100,000文
テスト文 10,000文
ディベロップメント文 1,000文

また統計翻訳の前処理として,日本語文に対して,``MeCab[13]"を用いて, 形態素解析を行う.また,英語文に対して,``tokenizer.perl[11]"を用いて, 分かち書きを行う.表[*]に単文コーパスの例を示す.

=23pt
表: 単文コーパスの例
日本語文 私 は 家 の 外 に 出 た 。
英語文 I went outside the house .
日本語文 私 は 山 に 登っ た 。
英語文 I climbed a mountain .
日本語文 私 は 雷 を 恐れる 。
英語文 I have a horror of thunder .



平成24年3月13日