次へ: 研究の背景
上へ: soturon6
戻る: 表一覧
目次
本研究は,非線形言語モデルに基づく日英機械翻訳[1]における格要素の
翻訳について現状を議論する.
非線形言語モデルは,まず大局的に,入力文の表現構造の意味を文単位のパター
ンで捉え,次に局所的に,そのパターンで定められる線形部分の意味を節,句,
単語等を単位とするパターンで捉えるというモデルである.単文のパターンにつ
いては,日本語語彙大系で示されており[2],重文・複文のパターンにつ
いては,「鳥バンク」で公開されている[3].
ここで,格要素は大きく2
種類がある.1つは文構造の意味を定める上で必須のもの,もう1つは任意のもの
である.必須のものとは格要素の内容が変わると文全体の解釈が変わるもので,た
とえば,「小遣いを貰う」と「嫁を貰う」ではヲ格の内容の違いにより,「所有
的移動」と「相対関係」という意味で違いが生じる.任意のものとは,その格要素
の解釈とその格要素以外の解釈を合成して文全体の解釈とできるもので,たとえ
ば,「バスで学校へ行く」では「学校へ行く」という意味に「バスで」という
「手段」の意味を線形的に加えることで,文全体が解釈できる.
日本語語彙大系においては,必須の格要素が洗練されて示されているが,任意の
格要素が体系的には示されいない.鳥バンクにおいては,約12万件の日英文対に
ついて,線形部分と非線形部分の識別によりパターン化が行われ,任意の格要素
の存在可能な位置が離散記号「/c」で示されたが,やはり,任意の格要素を陽
に示すことはできていない.
こうした状況では,パターン翻訳を行う際,入力文に文パターンが適合しても,
任意の格要素の翻訳が出来ないという問題がある.その解決には,任意の格要素
を解釈するためのパターン辞書を新たに作成する必要がある.
一般的に,日英翻訳において任意の(=必須でない)日本語格要素は英語前置詞
句で翻訳することが適当であるとすると,先行研究に見られるアライメント手法
で格要素と前置詞句の対を抽出することが,解決方法の1つと言える[5],
[6].しかし,本稿では,鳥バンクにおける重文・複文の文型パター
ン辞書において,既に単語・句のアライメントがマークアップされていることに
着目し,この辞書から格要素と前置詞句の対を抽出する方法を試みる.
非線形言語モデルに基づく格要素の扱いにおいて,(1) 格要素と前置詞句の対が
任意のものとして使用可能かどうか,(2) 任意であるならばその解釈をどうする
か(たとえば,「バスで」が「手段」と解釈するように)という点を考えなければな
らない.このうち本稿では,格要素と前置詞句の対の収集の試行,および,収集
した全てを任意格要素と仮定して使用した翻訳の問題分析までを行うことを目的
とする.
平成22年2月11日