過去の研究に,単文での文パターン辞書作成が行われている[6]. 作成方法としては,大量の対訳コーパスと対訳単語辞書を用いて,対となる名詞 などを変数化する.また翻訳時の変数部を単語に置き換える際,置き換える単語 の候補をしぼるために,品詞や字面などの意味属性制約を変数に付与する.この 過程により,文パターン辞書を作成する.表2.1に[6]で 作成された文パターンの例を示す.
日本語原文 | 彼はその戦闘で傷を受けた。 |
英語原文 | He was wounded in that battle. |
日本語文パターン | PRO1はREN2N3で傷を受けた。 |
英語文パターン | PRO1 was wounded in REN2 N3. |
表2.1の例では,PROは代名詞,RENは連体詞,Nは名詞を表しており,翻訳時に置き換える単語が限定される.しかし,第4章で詳しく説明する,本研究で作成する文パターンではカバー率を向上するために,意味属性制約などの制約は用いない.