次へ: 目次
上へ: soturon
戻る: soturon
目次
近年,翻訳方式として,文型パターンを用いた翻訳方法が注目されている.
文型パターン翻訳では,翻訳対象となる原言語と目的言語の表現を文型パ
ターンによって記述しておき,意味的に等価なパターンを対応づけることで,意
味の失われない解析を実現しようとしている.
この方式を実現するためには,あらかじめ,原言語と目的言語の対訳文から,意
味的に非線形な構造を取り出して「対訳文型パターン辞書」を作成することが必
要となる.
ここで,言語表現の非線形要素とは,特定の概念を表現するための表現構造の要
素のうち,他の要素に置き換えたら表現構造全体の意味が変わってしまうとき,
その要素をその表現構造の「非線形要素」と言う.そして,1つ以上の非線形要
素を有する表現構造を「非線形な表現構造」と言う.
文型パターン辞書構築の最大の問題は,文型パターンの網羅性と意味
的排他性をいかにして実現するかの2点である.
このうち,網羅性を実現するには,大量の文型パターンを汎化する必要がある.
その汎化方法の1つとして,
任意の文型要素が存在しても良い位置を表す「原文任意要素」と,文型パターン
要素のうち,省略可能な要素を示す「文型任意要素」が文型パターンに追加され
ている.
しかし,これらの任意要素指定機能は,実際,文型パターンの被覆率向上にどの
くらいの効果をもたらしているか分かっていない.
そこで本研究では,任意要素指定機能による被覆率の向上の効果を評価する
ことを目的とする.
被覆率を評価するパラメータとしては,「文型再現率」や,「平均適合パター
ン数」などが提案されているが,文型パターン辞書の規模がどのくらい拡大し
たかを直感的に測るために,本研究では,文型パターンの被覆率の向上の
効果を推定するパラメータ(文型パターン拡大率)を提案する.
そして,を用いて,任意要素指定機能の効果を評価する.
具体的な検証方法として,まず,現在使用されているパターン辞書(基準辞
書)から,任意要素指定機能を除き,対象辞書を作成する.次に,文型パターン
パーサを用いて,基準辞書および対象辞書のそれぞれとテスト用入力文を照合する.
得られた照合結果から,各対象辞書の被覆率を,文型再現率R1,および,平均適
合パターン数Nを用いて求める.
そして,被覆率の結果から,文型パターン拡大率を用いて,被覆率の向上
の効果を推定する.
調査の結果,原文任意要素を文型パターン
の記述に用いると,文型パターン辞書を7〜20倍に拡大したことに相当し,同様に,
文型任意要素を文型パターンに用いると,文型パターン辞書を1.4〜2.6倍に
拡大したことに相当することが分かった.
よって,任意要素指定機能は,被覆率を大きく向上させる機能であること
が定量的に分かった.
平成17年3月23日