next up previous
Next: 変数定義 Up: 日英対訳パターンの作成 Previous: 日英対訳パターンの作成

作成手順


2章で定義した単文の条件に従い,CREST対訳例文100万件[3]より抽出し た単文215,242件に対して日英対訳パターンを作成する.日英対訳パターンの作成手順を以下に示す.
  1. 日英対訳文を用意
    日英対訳文を用意し,日本語文を形態素解析にかける.形態素解析には,ALTーJAWS[4]を使用する.
  2. 変数の決定
    ALTの日英対訳辞書を用いて日本語単語に対応する英語単語を見つける.本研究では,7 つの日英対訳辞書を用いる.各々の辞書は品詞別に単語が登録されており, 形態素解析結果の品詞コードで使用する辞書を判断する.対訳辞書によって 対応関係が決定できた単語を日英同一の変数に置き換える.変数に置き換 えられた順番に変数に番号を付ける.表1に例を示す.


    Table 1: 変数の例
    品詞 日本語単語 英語単語 変数
    名詞 sister N1
    代名詞 I PRO2

  3. 単語を変数に置換
    日英対訳文中の単語を決定された変数に置き換える.



Jin'ichi Murakami 2006-03-11