next up previous contents
次へ: 単語に基づく統計翻訳器の検討 上へ: 考察 戻る: 英日対訳単語辞書の翻訳確率   目次

日英方向におけるパターン翻訳との比較

過去に西村らは1節の先行手法を用いて日英翻訳実験を行った.単文テストデータ10,000文に対し,閾値0.01(53,185語登録)の日英対訳単語辞書を用いた日英文パターン辞書と閾値0.02(34,587語登録)の日英対訳単語辞書を用いて先行手法を行い,2,103文が日本語文パターンに照合した.
 文パターンに照合した文数を比較すると,先行手法が2,103文であるのに対し本実験では3252文と英日翻訳の方が1,000文以上多く文パターンに照合している.先行手法と本実験に使用した文パターン辞書と対訳単語辞書の閾値および登録単語数が同じでないため単純な比較はできないが,日英翻訳に比べ英日翻訳の方がパターンに照合し易いと考えられる.
 この理由として英語と日本語間での表現方法の違いが挙げられる.例えば英文 "I climb the mountain ." は単語を入れ替えて"I the climb mountain." と表現すると文章として成立しなくなる.しかし日本語文は "私は山に登る。" の単語を入れ替えて "山に私は登る。"と表現しても文章として成立する.このように日本語文は語順が自由であり,複数の表現が生成されるため文パターンに照合しにくい.一方で英文は表現方法が限られているため英語文パターンに照合し易かったと思われる.



eki takashi 平成24年3月13日