next up previous contents
Next: Contents Up: 抽象名詞で形成される表現の意味的類型化と翻訳規則 Previous: 抽象名詞で形成される表現の意味的類型化と翻訳規則

概要

自然言語処理の最大の問題点は、表現の構造と意味に関する解釈の多様性である。 機械翻訳においては,訳文品質低下の原因は,動詞や名詞の訳語選択の不自然性 と文の構造$\cdot $係り受けにあるとされている.本研究では日本語文において 構造と意味に深く関係している抽象名詞「の」「こと」「もの」「ところ」「わ け」「とき」を取り上げ,翻訳のための規則を構築した.

本研究では日本語文中の使用環境から,抽象名詞を「語彙的意味をもつもの」と 「文法的意味をもつもの」に分類し,さらに「文法的意味をもつもの」を「補助 動詞的用法」と「非補助動詞的用法」に分類した.これは,英語表現における基 本的な役割を特定するのに役立つ.さらに,抽象名詞「の」に関しては交替現象 を解析することで,その他の抽象名詞の翻訳規則を利用する手法を提案した.

新聞記事を対象に評価実験を行った結果,交替現象の解析規則の正解率は 96.9% (188/194),翻訳規則の正解率は64.5%(517/801)であった.

評価結果より,不正解となった文には規則の拡充$\cdot $改良で改善する表現のほ か,新たな辞書を必要とする表現や,前後の文章を参照する必要がある表現など があった.



Noboru KURUMAI
2001-03-20