next up previous contents
次へ: 日英統計翻訳システム 上へ: 日英パターン翻訳システム 戻る: パターン翻訳の手順   目次

日英文パターン辞書

日英文パターン辞書とは,大量の対訳コーパスから対応する単語を変数により置 き換えることで得られる文パターンのデータベースである.

過去の研究に,単文での文パターン辞書作成が行われている[4]. 作成方法としては,大量の対訳コーパスと対訳単語辞書を用いて,対となる名詞 などを変数化する.また翻訳時の変数部を単語に置き換える際,置き換える単語 の候補をしぼるために,品詞や字面などの意味属性制約を変数に付与する.この 過程により,文パターン辞書を作成する.表2.1に[4]で 作成された文パターンの例を示す.


表 2.1: 日英文パターンの例
日本語原文 彼はその戦闘で傷を受けた。
英語原文 He was wounded in that battle.
日本語文パターン PRO1はREN2N3で傷を受けた。
英語文パターン PRO1 was wounded in REN2 N3.

2.1の例では,PROは代名詞,RENは連体詞,Nは名 詞を表しており,翻訳時に置き換える単語が限定される.しかし,第 [*]章で詳しく説明する,本研究で作成する文パターンでは意味 属性制約などは使用せず,適合する単語の全ての組合せの出力を行う.



平成22年2月11日