next up previous contents
次へ: 翻訳精度の評価 上へ: 翻訳実験 戻る: 学習データ   目次

フレーズテーブル

ベースラインのフレーズ数,追加したフレーズ数,提案手法のフレーズ数を表5.1に 示す.
=0.8cm
表 5.1: 総フレーズ数
  プログラム作成 人手作成数 追加後
日英翻訳(単文) 572,130 130,893 703,023
日英翻訳(重文複文) 727,849 130,893 858,742
英日翻訳 729,410 131,514 860,924

提案手法では,人手で作成した261,453個の翻訳対のうち日英翻訳には130,893個, 英日翻訳には131,514個の翻訳対に確率値が付与された. 実際に追加した翻訳対の例を表5.2に示す.


=1cm
表 5.2: 確率値を与えた翻訳対の例
コート の すそ $\vert\vert\vert$ the edge of my coat $\vert\vert\vert$
0.5 0.00190997 0.25 6.48554e-06
朝晩 の ラッシュ 時 に 電車 に 乗る $\vert\vert\vert$
take the train during the morning and evening rush hours $\vert\vert\vert$
0.1 6.68278e-20 0.125 1.83956e-24
国産 の コート は 英国 製 より だいぶ 落ちる $\vert\vert\vert$
home-made coats are by far inferior to those made in britain $\vert\vert\vert$
0.05 8.90443e-29 0.0454545 5.07768e-33
こういう テレビ ドラマ は 子ども たち に 悪影響 を 及ぼす $\vert\vert\vert$
this kind of tv drama will have a bad influence on children $\vert\vert\vert$
0.25 1.0859e-16 0.5 4.22243e-19
この 子 が 早く 一人前 の 社会 人 に なれる $\vert\vert\vert$
my son will become a respectable member of society as soon as possible $\vert\vert\vert$
0.0833333 8.60939e-21 0.047619 9.72723e-30
女子 の ほう が 男子 より も 早熟 だ $\vert\vert\vert$
girls mature earlier than boys $\vert\vert\vert$
0.0833333 2.3248e-18 0.125 8.9503e-11
政府 の 交替 が 改革 の 必要 条件 で ある $\vert\vert\vert$
a change of government is a prerequisite of reform $\vert\vert\vert$
0.0909091 1.7401e-15 0.25 4.02375e-12
東海道新幹線 は 平均 時速 1 6 6 キロ で 走り $\vert\vert\vert$
the tokaido shinkansen runs at an average speed of 166 kilometers per hour $\vert\vert\vert$
0.333333 1.71576e-27 0.0333333 3.5892e-40

尚,第10章の付録2と付録3に追加した翻訳対の更なる例を示す.


next up previous contents
次へ: 翻訳精度の評価 上へ: 翻訳実験 戻る: 学習データ   目次
平成21年3月17日