next up previous contents
Next: 変数定義 Up: 日英対訳パターンの作成 Previous: 日英対訳パターンの作成   Contents

作成手順

2章で得られた単文215,242件に対して日英対訳パターンを作成する.日英対訳パターンの作成手順を以下に示す.
  1. 日英対訳文を用意
    日英対訳文を用意し,日本語文を形態素解析にかける[4].日英対訳例文と日本語文の形態素解析結果の一部を表2に示す.
    Table 2: 形態素解析結果の一部
    単語 品詞コード 品詞 標準表記
    1100 一般名詞
    7530 付属語副助詞
    1710 人称代名詞
    7420 付属語格助詞
    同じ 3217 形容動詞 同じだ
    くらい 7520 付属語副助詞 くらい
    一所懸命 1240 用言性名詞 一所懸命
    勉強 1230 用言性名詞 勉強
    する 2636 動詞 する
    0110 文末記号

  2. 変数の決定
    日英対照辞書を用いて日本語単語に対応する英語単語を見つける.本研究では,7 つの日英対照辞書を用いる.表3に日英対照辞書の例を示す. 各々の辞書には日本語単語と対応する英語単語が掲載されており,形態素解析結果の品詞コードで使用する辞書を判断する.例えば,名詞「妹」 を日英対照辞書の名詞辞書において発見し,「妹」の訳語が「sister」で あり,英語文中の「sister」と対応関係がとれるので「妹」「sister」を 同じ変数「N」と決定する.代名詞「私」と「I」についても同様にして変 数「PRO」と決定する.本研究では,日英対訳辞書によって対応関係がとれる単 語のみを変数化する.表4に変数の例を示す.

    Table 3: 変数の例
    辞書名 日本語単語 英語単語  
    名詞辞書(noun_dic) 災害 disaster  
    固有名詞辞書(pnoun_dic) ギリシア共和国 Hellenic Republic  
    副詞辞書(adv_dic) どちらにしても anyhow,anyway,in either case  
    連体詞(adj_dic) あくせく restlessly,in a fidget,busily  
    代名詞(pro_dic) あなた you  
    形容詞(adj_dic) だるい be tired,be dull,dull,feel weary,tired  
    動詞(verb_dic) はしゃぐ be in high spirits,frolic,romp about  


    Table 4: 変数の例
    品詞 日本語単語 英語単語 変数
    名詞 sister N
    代名詞 I PRO

  3. 単語を変数に置換
    日英対訳文中の単語を決定された変数に置き換える.そのとき,対応付けのため,変数化された順番に変数に番号を付ける.

next up previous contents
Next: 変数定義 Up: 日英対訳パターンの作成 Previous: 日英対訳パターンの作成   Contents
Jin'ichi Murakami 2006-03-11