next up previous contents
次へ: 実験環境 上へ: 提案手法 戻る: 概要   目次

提案手法の手順

手順1
前処理としての日英'ルールベース翻訳
前処理として,日英対訳コーパス(学習データ,テストデータ,ディベロップメントデータ)の日 本語文に対して,ルールベース翻訳でそれぞれ日英'翻訳を行なう. 入力例,出力例,正解例を以下に示す.

入力例(日本語文)
免許をとった。
その許可が当局から下りた。
天文学は高尚な科学である。
彼は大声で泣いた。
この箱はどうしても持ち上がらない。
出力例(ルールベース翻訳)
It got the license.
The permission descended from authorities .
Astronomy is a noble science .
He cried loudly.
This box doesn't lift.
正解例(英語文)
I obtained a license.
That permission has come from the authorities.
Astronomy is a noble science.
He cried loudly.
This box won't lift.

手順2
翻訳モデルの作成
前処理を行なった学習データの英語文と日英対訳コーパスの英語文を用いて,英' 英翻訳モデルを作成する.英'英フレーズテーブルの例を以下に示す.

英'英フレーズテーブルの例
It got the license $\vert\vert\vert$ I obtained a license $\vert\vert\vert$ (0) (1) (2) (3) $\vert\vert\vert$ (0) (1) (2) (3) $\vert\vert\vert$ 1.000 0.000 1.000 0.000
The permission descended $\vert\vert\vert$ That permission has come $\vert\vert\vert$ (0) (1) (1,2,3) $\vert\vert\vert$ (0) (1,2) (2) (2) $\vert\vert\vert$ 1.00 0.002 1.00 0.00
Astronomy $\vert\vert\vert$ Astronomy $\vert\vert\vert$ (0) $\vert\vert\vert$ (0) $\vert\vert\vert$ 1.00 1.00 1.00 1.00
loudly $\vert\vert\vert$ loudly $\vert\vert\vert$ (0) $\vert\vert\vert$ (0) $\vert\vert\vert$ 0.688 0.289 0.733 0.344
This box $\vert\vert\vert$ This box $\vert\vert\vert$ (0) (1) $\vert\vert\vert$ (0) (1) $\vert\vert\vert$ 0.625 0.512 0.833 0.421

手順3
言語モデルの作成
日英対訳コーパスの英語文から言語モデルを作成する.

手順4
英'英統計翻訳
手順1で作成した言語モデルと手順3で作成した翻訳モデルを用いて,統計翻訳で英' 英翻訳を行なう.


next up previous contents
次へ: 実験環境 上へ: 提案手法 戻る: 概要   目次
平成22年2月11日