next up previous contents
次へ: 謝辞 上へ: honron0215-4 戻る: パタ−ン化の問題   目次

おわりに

近年,標本文には多くの線形要素が存在すること,文型パターン化作業の大半が 機械化できることが分かり,大量のパタ−ンを作ることが可能となったことで, 「文型パタ−ン」による翻訳が注目されている. 最近では,重文・複文の日英機械翻訳にこの「文型パターン」を用いる手法が提 案されており[1]. その手法では, パターンの記述要素に名詞句変数が使われ,その変数に 代入された日本語表現を英訳する必要があった.

そこで,本研究では, 大規模名詞句コーパスより,名詞句パタ−ンを自動生成し, 名詞句パターン辞書を作成した. そして, 名詞句翻 訳プロトタイプシステム(Meijin)を用いて,名詞句パタ−ン辞書の性能評価を 行った. この結果は,再現率は75%,適合率は約99%であった. 適合率とは,パタ−ンの候補があった名詞句において,文法的,意味的に正しかっ た割合であり, 本研究で作成した名詞句パタ−ン辞書の有効性があったと考えられる.

今後の課題は, 意味属性の汎化や名詞句パターンのアライメントの精密化,複合名詞への対応, および,標本を増やすことによる新たなル−ルの作成である.



平成17年3月23日