次へ: 結合価文法による訳語選択 上へ: honron 戻る: 表一覧目次

まえがき

機械翻訳において訳語選択は，重要であると同時に大変困難な問題の一つである[1]．特に日本語と英語のように言語族の異なる言語間においては，対象の捉え方の違いによって訳語選択の問題をより困難にしていると考えられている．また日英機械翻訳における訳文品質の分析[16]において，訳語選択の不適切さが訳文品質低下の原因の40%を占め，構文解析の誤り(25%)を抜いて最大であると報告されている．訳語選択の精度を向上させるためには，文中で使用された単語の意味(語義)を解析する必要がある．

これまでに動詞の意味解析の方法としては共起レベルと頻度をパラメータとした「尤度」，および辞書的記述に基づいた「制約」を用いる方法[5]や単語の共起関係を用いた方法[15] などが提案されているが，訳語選択において高い精度を出すに至っていない．また，名詞の意味解析の方法としては，談話解析で得られた場面情報により，英語名詞の多義を解消する方法[5]や連体修飾句の係る名詞を対象に格の情報と意味属性を用いる方法[15]が提案されている. 最近では名詞辞書における多義構造の記述に関する研究[7] [15]もあるが対象は限定的である．

このような状況の下，多段翻訳方式が提案され，日英機械翻訳システム「ALT-J/E」が開発された．この翻訳方式では結合価文法[15]に基づいた単文レベルの日英文型パターン対を用いて日本語から英語へ表現の変換を行なっている．ここで結合価文法はその構造から，動詞と名詞の訳し分けに有効と考えられるが，その効果は定量的には明らかにされていない．

そこで本研究では，結合価文法による動詞と名詞の訳語選択の有効性を定量的に検証するために，ALT-J/Eの訳文評価実験を行ない，その効果を定量的に明らかにする．ここで基本的な動詞および名詞の訳し分けを評価するために，「計算機用日本語基本動詞，名詞辞書IPAL」[10](以下，「IPAL辞書」とする)に登録されている基本動詞と基本名詞を含む単文の対訳を対象とする．IPAL辞書に登録さている語は日常的に用いられる語を網羅しており，また基本的な語ほど多義を持つという観点から本稿の趣旨に適切と考え用いるものとする．次に評価実験の結果から訳語選択を誤った文について，今後結合価文法で訳語選択できる語の種類と，訳し分けに必要な知識について検証を行ない，結合価文法の有効性の範囲と限界を明らかにする．

本稿では以下，第２章では結合価文法による訳語選択，第３章では評価実験，第４章では実験結果，第５章に考察，第６章でまとめを述べる．

平成15年5月19日