next up previous contents
次へ: フレーズテーブルのフレーズ対の数 上へ: 学習データの英語文に対する提案手法の適用 戻る: 学習データの英語文に対する提案手法の適用   目次

英語文に対する提案手法の適用法

日本語文の文節区切りに相当する処理として,英語構文解析器``Apple Pie Parser[17]''を用いて学習データの英語文の単語をフレーズ単位に結合す る.フレーズテーブルの生成手順を以下に示す.

  1. 英語文をフレーズ単位に結合
    学習データの英語文をフレーズ単位に統合する.
    フレーズ単位の結合の例
    He is an-able-merchant .
    The-bird winged its-flight over the-hills .
    His-room is approached by a-flight of steps .
    I could not recognize the-girl from the-vague-description of her you gave me .
    Father loves using his-new-word-processor .

  2. フレーズテーブルの生成
    フレーズ単位に統合された学習データから,フレーズテーブルを生成する.
    1から生成されたフレーズテーブル
    有能 な 商人 $ \vert\vert\vert$ an-able-merchant $ \vert\vert\vert$ 1 0.028 1 0.003
    丘 を $ \vert\vert\vert$ the-hill $ \vert\vert\vert$ 0.33 0.25 1 0.15
    丘 を 越え て $ \vert\vert\vert$ over the-hill $ \vert\vert\vert$ 0.5 0.004 0.33 0.005
    贅肉 が つき $ \vert\vert\vert$ put on superfluous-flesh $ \vert\vert\vert$ 1 0.0009 1 0.0013
    $ \vert\vert\vert$ a-pair of scissors $ \vert\vert\vert$ 1 0.1801 0.5 0.003

  3. 英語フレーズの処理
    従来手法のフレーズテーブルと区切りを統一するために,生成されたフレーズテー ブルの英語フレーズを単語に区切る.
    文節区切りフレーズテーブル
    有能 な 商人 $ \vert\vert\vert$ an able merchant $ \vert\vert\vert$ 1 0.028 1 0.003
    丘 を $ \vert\vert\vert$ the hill $ \vert\vert\vert$ 0.33 0.25 1 0.15
    丘 を 越え て $ \vert\vert\vert$ over the hill $ \vert\vert\vert$ 0.5 0.004 0.33 0.005
    贅肉 が つき $ \vert\vert\vert$ put on superfluous flesh $ \vert\vert\vert$ 1 0.0009 1 0.0013
    $ \vert\vert\vert$ a pair of scissors $ \vert\vert\vert$ 1 0.1801 0.5 0.003

生成されたフレーズテーブルは,[*]章と同様に,従来手法のフレー ズテーブルと併用し翻訳を行う.また,実験には以下の2種類の学習データから 生成されたフレーズテーブルを用いる.

  1. 日本語文:単語区切り,英語文:フレーズ単位

    単語区切りの日本語文とフレーズ単位の英語文からフレーズテーブルを生 成する.これは,一方の言語にのみ処理を行った場合の効果を調べるため に用いる.

  2. 日本語文:文節区切り,英語文:フレーズ単位

    文節区切りの日本語文とフレーズ単位の英語文からフレーズテーブルを生 成する.これは,両言語に処理を行った場合の効果を調べるために用いる. このとき,日本語フレーズは文節区切りであるため,手順3で単語に区切る.


next up previous contents
次へ: フレーズテーブルのフレーズ対の数 上へ: 学習データの英語文に対する提案手法の適用 戻る: 学習データの英語文に対する提案手法の適用   目次
平成22年2月17日