next up previous contents
次へ: 実験環境 上へ: 文法構造の変換による翻訳 戻る: 動詞の定義   目次

提案方法の手順

本研究では,形態素解析を用いて近似的に日本語の文法構造を変換する.その手順を以下に示す.

  1. 文章中の句読点を削除する.
    例1:私は一時的に実験を中止した
  2. 日本語文に対しMecabを用いて形態素解析を行う.
    例2:私は一時的に実験を中止した
    私 名詞,代名詞,一般,私
    は 助詞,係助詞,は
    一時 名詞,副詞可能,一時
    的 名詞,接尾,形容動詞語幹,的
    に 助詞,副詞化,に
    実験 名詞,サ変接続,実験
    を 助詞,格助詞,一般,を
    中止 名詞,サ変接続,中止
    し 動詞,自立,サ変・スル,連用形
    た 助動詞,特殊・タ,基本形,た
  3. 最初に現れる格助詞「が」または係助詞「は」の位置を特定する.
    例3 : 私 一時 的 に 実験 を 中止 し た
  4. 「が」または「は」がない場合,仮の主語である「$<任意主語>$ は」を文頭に付与する.この「$<任意主語>$ は」を文頭につける理由は,主語がない日本語文に対して,動詞を目的語の前に移動するためである.
  5. 「が」または「は」の前に名詞がある場合,文章のはじめから特定した「が」または「は」の位置までを主語とする.例4では,「私 は」を主語である.
    例5 : 私 は 一時 的 に 実験 を 中止 し た
  6. 文末にあるフレーズを動詞とする.例5では,「中止 し た」が動詞である.
    例6 : 私 は 一時 的 に 実験 を 中止 し た
  7. 主語の後ろに動詞を移動する.
    例7 : 私 は 中止 し た 一時 的 に 実験 を
  8. $<任意主語>$ は」がある場合,動詞を移動する前と後の文字数があわなくなる.よって,これを削除する.
  9. 動詞の位置を変更した文章に対して,スペースを削除し,文末に「。」をつける.
  10. 通常の日英統計翻訳に用いる日本語文はChasenを用いてわかち書きをしているため,提案方法で作成した文をChasen用いてわかち書きを行う.



平成21年3月19日