next up previous contents
Next: 英語パターンの汎化 Up: 汎化によるパターンの縮退 Previous: 汎化によるパターンの縮退   Contents

日本語パターンの汎化

単文は,文構造が簡単であるため,単文の文型パターンは,かなりの割合で同一化 できると予想していた.しかし,本研究で得られた文型パターンにおいて重複する 日本語パターンを削減した所,原文215,242件に対して削減できたパターン数は,13,488件と低かった.また,同一化できそうな日本語パターンについて検証するため,動的計画法で類似の日本語パターンを検索した.以下に例を示す.

日本語パターン[A]と[B]は,類似したパターンであるが,英語パターン[a]と[b] は意味的に全く異なっている.そのため,英語パターン[b]を用いて日本語パター ン[A]の英語の原文'The skies have become considerably brighter.を訳出す ることは難しい.従って,日本語パターンを汎化することは困難であると考えられ る.

Jin'ichi Murakami 2006-03-11