next up previous
Next: 英語パターンの汎化 Up: 汎化によるパターンの縮退 Previous: 汎化によるパターンの縮退

日本語パターンの汎化


単文は,文構造が簡単であるため,単文の文型パターンは,かなりの割合で同一化 できると予想していた.しかし,本研究で得られた文型パターンにおいて重複する 日本語パターンを削減した所,原文215,242件に対して削減できたパターン数は, 13,488件と低かった.
また,同一化できそうな日本語パターンに ついて検証するため,動的計画法で類似の日本語パターンを検索した.以下に結果を示す.

日本語パターン[A]と[B]は,類似したパターンであるが,英語パターン[a]と[b] は意味的に全く異なっている.そのため,英語パターン[b]を用いて日本語パター ン[A]の英語の原文'The skies have become considerably brighter.を訳出す ることは難しい.また,10文を動的計画法で調査した所,同様の結果が得られた.従っ て,日本語パターンを自動的に汎化することは困難であると考えている.今後は, 人手を含めた半自動化の方法も考えている.


Jin'ichi Murakami 2006-03-11