next up previous contents
次へ: 実験環境 上へ: 提案手法 戻る: 提案手法   目次

提案手法の流れ

日英統計翻訳の場合の提案手法の流れを図4.1に示す.

図: 提案手法の流れ

\includegraphics[width=160mm]{eijiro.eps}

手順1
人手で作成された対訳フレーズ辞書のフレーズ対と,学習データ(日本語文(1)と英語文(1))のマッチングを行う. 一致した場合は手順2を行う.例を表4.1に示す.表4.1の例では,学習データの英語文に `` old story''日本語文に `` ありふれ た 話''が含まれる文がマッチングする. また,学習データの英語文に `` I''日本語文に `` 私 は''が含まれる文と,英語文に `` coming of age ceremony''日本語文に ``成人 式''が含まれる文とマッチングする.


表: マッチングの例
対訳フレーズ対 : old story $\mid \mid \mid $ ありふれ た 話 
  : I $\mid \mid \mid $ 私 は
  : coming of age ceremony $\mid \mid \mid $ 成人 式
学習データ 日本語文(1) : それ は ありふれた 話 だ 。
学習データ 英語文(1) : It is an old story .
学習データ 日本語文(1) : 私 は 成人 式 に 出席 し た 。
学習データ 英語文(1) : I attended a coming of age ceremony .

手順2
学習データの一致した英語フレーズと日本語フレーズをそれぞれ一つのまとまりとするために,単語間のスペースを`` -''に置き換えた対訳フレーズデータの日本語文(2)と英語文(2)を作成する. 例を表4.2に示す.


表: 対訳フレーズデータの例
対訳フレーズデータ 日本語文(2) : それ は ありふれ-た-話 だ 。
対訳フレーズデータ 英語文(2) : It is an old-story .
対訳フレーズデータ 日本語文(2) : 私-は 成人-式 に 出席 し た 。
対訳フレーズデータ 英語文(2) : I attended a coming-of-age-ceremony .

手順3
学習データと手順2で作成した対訳フレーズデータを用い,フレーズテーブルを作成する.

手順4
学習データのみから学習した言語モデルを用いるため,フレーズテーブルに含まれる `` -''を取り除く. 例を表4.3と表4.4に示す.


表: `` -'' を取り除く前のフレーズテーブル
それ は $\mid \mid \mid $ It is $\mid \mid \mid $ 1 1 1 1  
ありふれ-た-話 だ 。 $\mid \mid \mid $ an old-story . $\mid \mid \mid $ 1 1 1 1  
ありふれ-た-話 $\mid \mid \mid $ old-story $\mid \mid \mid $ 1 1 1 1  
私-は $\mid \mid \mid $ I $\mid \mid \mid $ 1 1 1 1  
成人-式 $\mid \mid \mid $ coming-of-age-ceremony $\mid \mid \mid $ 1 1 1 1  
出席 し た $\mid \mid \mid $ attended $\mid \mid \mid $ 1 1 1 1  


表: `` -'' を取り除いた後のフレーズテーブル
それ は $\mid \mid \mid $ It is $\mid \mid \mid $ 1 1 1 1  
ありふれ た 話 だ 。 $\mid \mid \mid $ an old story . $\mid \mid \mid $ 1 1 1 1  
ありふれ た 話 $\mid \mid \mid $ old story $\mid \mid \mid $ 1 1 1 1  
私 は $\mid \mid \mid $ I $\mid \mid \mid $ 1 1 1 1  
成人 式 $\mid \mid \mid $ coming of age ceremony $\mid \mid \mid $ 1 1 1 1  
出席 し た $\mid \mid \mid $ attended $\mid \mid \mid $ 1 1 1 1  

手順5
手順4で作成したフレーズテーブルを用いて日英統計翻訳を行う.


next up previous contents
次へ: 実験環境 上へ: 提案手法 戻る: 提案手法   目次
平成23年3月23日