機械翻訳において訳語選択は,重要であると同時に大 変困難な問題の一つである[1]. 特に日本語と英語のように言語族の異なる言語間においては,対象 の捉え方の違いによって訳語選択の問題をより困難にしていると考えられてい る.また日英機械翻訳における訳文品質の分析[16]において,訳語選択の不適切さ が訳文品質低下の原因の40%を占め,構文解析の誤り(25%)を抜いて最大であ ると報告されている. 訳語選択の精度を向上させるためには,文中で使用された単語の意味(語義)を 解析する必要がある.
これまでに動詞の意味解析の方法としては共起レベル と頻度をパラメータとした「尤度」,および辞書的記述に基づいた「制約」を用い る方法[5]や単語の共起関係を用いた方法[15] などが提案されているが,訳語選択において高い精度を出すに至っていない. また,名詞の意味解析の方法としては,談話解析で得られた場面情報により, 英語名詞の多義を解消する方法[5]や連体修飾句の係る名詞を 対象に格の情報と意味属性を用いる方法[15]が提案されている. 最近では名詞辞書における多義構造の記述に関する研究[7] [15]もあるが対象は限定的である.
このような状況の下,多段翻訳方式が提案され,日英機械翻訳システム 「ALT-J/E」が開発された.この翻訳方式では結合価文法[15]に基づいた単文レベル の日英文型パターン対を用いて日本語から英語へ表現の変換を行なっている. ここで結合価文法はその構造から,動詞と名詞の訳し 分けに有効と考えられるが,その効果は定量的には明らかにされていない.
そこで本研究では,結合価文法による動詞と名詞の訳語選択の有効性を 定量的に検証するために,ALT-J/Eの訳文評価実験を行ない, その効果を定量的に明らかにする.ここで基本的な動詞および名詞の訳し分けを 評価するために,「計算機用日 本語基本動詞,名詞辞書IPAL」[10](以下,「IPAL辞書」とする)に 登録されている基本動詞と基本名詞を含む単文の対訳を対象とする.IPAL辞書 に登録さている語は日常的に用いられる語を網羅しており,また基本的な語ほ ど多義を持つという観点から本稿の趣旨に適切と考え用いるものとする. 次に評価実験の結果から訳語選択を誤った文について,今後結合価文法で訳語 選択できる語の種類と,訳し分けに必要な知識について検証を行ない,結合価 文法の有効性の範囲と限界を明らかにする.
本稿では以下,第2章では結合価文法による訳語選択,第3章では評価実験,第 4章では実験結果,第5章に考察,第6章でまとめを述べる.