Next: 英語パターンの汎化
Up: 汎化によるパターンの縮退
Previous: 汎化によるパターンの縮退
単文は,文構造が簡単であるため,単文の文型パターンは,かなりの割合で同一化
できると予想していた.しかし,本研究で得られた文型パターンにおいて重複する
日本語パターンを削減した所,原文215,242件に対して削減できたパターン数は,
13,488件と低かった.
また,同一化できそうな日本語パターンに
ついて検証するため,動的計画法で類似の日本語パターンを検索した.以下に結果を示す.
- 日本語パターン[A] … N1がADV2ADJ3くなってきた。
- 日本語の原文
- 対応する英語パターン[a]
- The N1pl have become ADV2 ADJ3Î<>er.
- 英語の原文
- The skies have become considerably brighter.
- 日本語パターン[B] … N1がADV2弱くなってきた。
- 日本語の原文
- 対応する英語パターン[b]
- His N1 has ADV2 weakened.
- 英語の原文
- His pulse has gradually weakened.
日本語パターン[A]と[B]は,類似したパターンであるが,英語パターン[a]と[b]
は意味的に全く異なっている.そのため,英語パターン[b]を用いて日本語パター
ン[A]の英語の原文'The skies have become considerably brighter.を訳出す
ることは難しい.また,10文を動的計画法で調査した所,同様の結果が得られた.従っ
て,日本語パターンを自動的に汎化することは困難であると考えている.今後は,
人手を含めた半自動化の方法も考えている.
Jin'ichi Murakami
2006-03-11