next up previous contents
次へ: 意味属性制約を使用しない 提案手法の実験 上へ: 提案手法の誤り解析 戻る: 適切な中間言語文の候補がない問題   目次


学習データ量の問題

翻訳文の中に,表5.4のような,未知語を含む文が多くあった. 原因として,学習データ量が不足していることが考えられる. ベースラインの学習データは,121,913文対であるのに対し,句レベルパター ンで作成できた中間言語文と英語文の学習データは,74,564文対である.したがっ て, 提案手法において,中間言語の日本語部分を翻訳するための情報が不足してしまっ たと考える.5.1.2節の場合と同様に,提案手法における学習データを増やす必要がある.


表 5.4: 未知語を含む翻訳文
翻訳文
She has been completely rose at her boy friend in プロポーズ .
Walk , you will take すくなくとも 20 mimutes .
When i spaghetti a ゆであがっ , i quickly to the sauce からめ .
I never busy ので and wait a little longer .
I went to the beach but so in attendance went ぐったり tired .
Some practice will not good くなら .



平成24年3月30日