next up previous contents
次へ: 実験環境 上へ: 提案手法 戻る: 提案手法   目次

翻訳対の追加手順

フレーズテーブルに翻訳対を追加する手順を図3.1に示す
図 3.1: 翻訳対の追加手順
\fbox{
\includegraphics[width=15cm]{tejun.eps}
}
手順1

学習データからパラメータ``grow-diag-final''でフレーズテーブ ルを作成 grow-diag-finalで作成したフレーズテーブルの例を表3.3に示す.

表 3.3: grow-diag-finalで作成したフレーズテーブルの例
あまりに $\vert\vert\vert$ too $\vert\vert\vert$ 0.0366492 0.0452586 0.203883 0.403846 2.718
あらゆる 種類 の $\vert\vert\vert$ all kinds of $\vert\vert\vert$ 0.0533333 2.14961e-05 0.153846 0.000173174 2.718
あらゆる 場合 に $\vert\vert\vert$ in every case $\vert\vert\vert$ 0.5 0.000685416 0.111111 0.00317505 2.718
あらゆる 点 で $\vert\vert\vert$ in every respect $\vert\vert\vert$ 0.0294118 0.000268458 0.333333 0.000197242 2.718
ありあり と $\vert\vert\vert$ visibly $\vert\vert\vert$ 0.0277778 0.0041493 0.0416667 0.166667 2.718

手順2

学習データからパラメータ``intersection''でフレーズテーブル を作成 intersectionで作成したフレーズテーブルの例を表3.4に示す.

表 3.4: intersectionで作成したフレーズテーブルの例
あらゆる $\vert\vert\vert$ every $\vert\vert\vert$ 0.0280778 0.0215589 0.288889 0.134021 2.718
あらゆる $\vert\vert\vert$ took every possible $\vert\vert\vert$ 0.5 0.0215589 0.0444444 4.12434e-08 2.718
いつ $\vert\vert\vert$ when and $\vert\vert\vert$ 0.5 0.002551 0.0102041 8.65508e-05 2.718
いつ $\vert\vert\vert$ when $\vert\vert\vert$ 0.00207039 0.002551 0.0102041 0.0098039 2.718
いつも $\vert\vert\vert$ as usual , $\vert\vert\vert$ 0.0454545 0.318841 0.00087184 2.394e-06 2.718
いつも $\vert\vert\vert$ always $\vert\vert\vert$ 0.0425532 0.318841 0.00348736 0.00021795 2.718
いつも の $\vert\vert\vert$ as usual , $\vert\vert\vert$ 0.0454545 0.0216902 0.0196078 2.394e-06 2.718
いつも の $\vert\vert\vert$ as usual $\vert\vert\vert$ 0.0425532 0.0216902 0.0784314 0.00021795 2.718
いつも の $\vert\vert\vert$ at eleven as usual $\vert\vert\vert$ 0.142857 0.0216902 0.0196078 3.71658e-11 2.718
いつも の $\vert\vert\vert$ eleven as usual $\vert\vert\vert$ 0.142857 0.0216902 0.0196078 4.18463e-09 2.718
いつも の よう に $\vert\vert\vert$ as usual $\vert\vert\vert$ 0.0106383 1.19086e-08 0.5 0.000154138 2.718
いつも の よう に $\vert\vert\vert$ usual $\vert\vert\vert$ 0.00564972 1.19086e-08 0.5 0.0294118 2.718

手順3

翻訳対の形式をフレーズテーブルの形式に変換 翻訳対の形式をフレーズテーブルの形式に変換した例を表3.5に示す.

表 3.5: 翻訳対の形式をフレーズテーブルの形式に変換した例
あらゆる $\vert\vert\vert$ all $\vert\vert\vert$
あらゆる $\vert\vert\vert$ every $\vert\vert\vert$
あらゆる $\vert\vert\vert$ multitude of, a $\vert\vert\vert$
いつ $\vert\vert\vert$ when $\vert\vert\vert$
いつ から $\vert\vert\vert$ from what time? $\vert\vert\vert$
いつ から $\vert\vert\vert$ how long? $\vert\vert\vert$
いつも $\vert\vert\vert$ always $\vert\vert\vert$
いつも $\vert\vert\vert$ at all times $\vert\vert\vert$
いつも $\vert\vert\vert$ at every moment $\vert\vert\vert$
いつも $\vert\vert\vert$ at every turn $\vert\vert\vert$
いつも の よう に $\vert\vert\vert$ as usual $\vert\vert\vert$
いつも の よう に $\vert\vert\vert$ as always $\vert\vert\vert$

手順4

手順2で作成したフレーズテーブルを参照して翻訳対に翻訳確率を 付与 翻訳対に翻訳確率を付与した例を表3.6に示す.


表 3.6: 翻訳対に翻訳確率を付与した例
あらゆる $\vert\vert\vert$ every $\vert\vert\vert$ 0.0280778 0.0215589 0.288889 0.134021 2.718
いつ $\vert\vert\vert$ when $\vert\vert\vert$ 0.00207039 0.002551 0.0102041 0.0098039 2.718
いつも $\vert\vert\vert$ always $\vert\vert\vert$ 0.0425532 0.318841 0.00348736 0.00021795 2.718
いつも の よう に $\vert\vert\vert$ as usual $\vert\vert\vert$ 0.0106383 1.19086e-08 0.5 0.000154138 2.718


翻訳対の日本語フレーズと英語フレーズがintersectionで作成したフレーズテー ブルのフレーズと一致した場合に,その翻訳確率を翻訳 対に付与する.例えば,表3.5の2行目``あ らゆる $\vert\vert\vert$ every $\vert\vert\vert$''に翻訳確率を付与する場合, 表3.4の``あらゆる $\vert\vert\vert$ every $\vert\vert\vert$ 0.0280778 0.0215589 0.288889 0.134021 2.718''1行目 の日本語フレーズと英語フレーズと一致する.よって, 翻訳対``あらゆる $\vert\vert\vert$ every $\vert\vert\vert$''に翻訳確率 ``0.0280778 0.0215589 0.288889 0.134021 2.718'' を付与する.

同様にして,``いつ $\vert\vert\vert$ when $\vert\vert\vert$ ''には,翻訳確 率``0.00207039 0.002551 0.0102041 0.0098039 2.718''を付与し, ``いつも $\vert\vert\vert$ always $\vert\vert\vert$'' に は,翻訳確率``0.0425532 0.318841 0.00348736 0.00021795 2.718''を付与し, ``いつも の よう に $\vert\vert\vert$ as usual $\vert\vert\vert$''には, ``0.0106383 1.19086e-08 0.5 0.000154138 2.718''を付与する.

手順5

手順1で作成したフレーズテーブルに翻訳確率を付与した翻訳対を 追加 手順1で作成したフレーズテーブルに翻訳確率を付与した翻訳対を追加した例を 表3.7に示す.

表 3.7: 手順1で作成したフレーズテーブルに翻訳確率を付与した翻訳対を追加した例
あまりに $\vert\vert\vert$ too $\vert\vert\vert$ 0.0366492 0.0452586 0.203883 0.403846 2.718
あらゆる 種類 の $\vert\vert\vert$ all kinds of $\vert\vert\vert$ 0.0533333 2.14961e-05 0.153846 0.000173174 2.718
あらゆる 場合 に $\vert\vert\vert$ in every case $\vert\vert\vert$ 0.5 0.000685416 0.111111 0.00317505 2.718
あらゆる 点 で $\vert\vert\vert$ in every respect $\vert\vert\vert$ 0.0294118 0.000268458 0.333333 0.000197242 2.718
ありあり と $\vert\vert\vert$ visibly $\vert\vert\vert$ 0.0277778 0.0041493 0.0416667 0.166667 2.718
あらゆる $\vert\vert\vert$ every $\vert\vert\vert$ 0.0280778 0.0215589 0.288889 0.134021 2.718
いつ $\vert\vert\vert$ when $\vert\vert\vert$ 0.00207039 0.002551 0.0102041 0.0098039 2.718
いつも $\vert\vert\vert$ always $\vert\vert\vert$ 0.0425532 0.318841 0.00348736 0.00021795 2.718
いつも の よう に $\vert\vert\vert$ as usual $\vert\vert\vert$ 0.0106383 1.19086e-08 0.5 0.000154138 2.718

なお,本稿では手順1のフレーズテーブルを用いた翻訳をベースライン, 手順5のフレーズテーブルを用いた翻訳を提案手法と呼ぶ.


next up previous contents
次へ: 実験環境 上へ: 提案手法 戻る: 提案手法   目次
平成22年2月13日