next up previous contents
次へ: 2) テストデータ 上へ: 実験データ 戻る: 実験データ   目次

1) 学習データ

句ベース統計翻訳の翻訳ルールを学習するために,辞書の例文より抽出した単文コーパス181,988文[22]から,学習データとして100,000文を用いる.単文コーパスの例文を表6.1に示す.



表: 単文コーパス例文
日本語文 昼食 を たっぷり 取っ た 。
英語文 I had a big lunch .
日本語文 梅雨が始まった。
英語文 The rainy season has set in .
日本語文 私 は 猫 を 1 匹 飼っ て いる 。
英語文 I have a cat .

主語省略文は,100,000文中10,459文である.なお,文献[3]では,学習データに対して主語補完を行った場合,翻訳精度の低下を報告している.よって本研究では学習データの主語省略文に対して主語補完を行わない.


平成25年2月13日