next up previous contents
次へ: モデルの作成結果 上へ: 分析実験 戻る: 分析実験   目次

予備実験

対訳句の特性を理解するため,予備実験を行う. 予備実験の結果,不適切な対応をとる対訳句において高い確率が付与される場合があることがわかった.例を表4.4に示す.


表: 日本語学習文における日本語句の出現回数が1回の例
日本語句$ J$ 英語句$ E$ $ count_{s}(J)$ $ count_{s}(E\vert J)$ $ \log P_{s}(E\vert J)$
部員 たち members 1 1 0
部員 たち were 1 1 0
部員 たち The 1 1 0

ここで, $ count_{s}(J)$ は日本語学習文における日本語句$ J$ の出現回数であり, $ count_{s}(E\vert J)$ は対訳学習文における対訳句($ J$ ,$ E$ )の共起回数, $ \log P_{s}(E\vert J)$ は対訳学習文における日英方向の対数翻訳確率である. 例えば日本語句``部員たち"の出現回数が1回の場合,その日本語句をもつすべての対訳句において,対訳学習文における日英方向の対数翻訳確率は0(最大値)になる. したがって句の出現回数が1回の場合,不適切な対応をとる対訳句においても高い確率が付与される. 以上のことから,本研究では句の抽出回数または学習文における句の出現回数が少なくとも一方の言語で1回である対訳句を取り除き,モデルの作成を行う.



平成27年3月13日