next up previous
次へ: 翻訳実験 上へ: 自動的に作成したフレーズテーブルへの翻訳対の追加(提案方法) 戻る: 翻訳対への翻訳確率の付与

翻訳対の追加手順

手作業で作成した翻訳対をフレーズテーブルに追加する手順を 図[*]に示す.

図: 手作業で作成したフレーズ対への確率値の付与方法
\includegraphics[width=12cm,clip]{ZZZ.eps}

手作業で作成した翻訳対をフレーズテーブルに追加する手順を以下に示す.

手順1
前処理

日英重複文文型パターン辞書[3]から対訳文を抽出し ``chasen[9]''で形態素解析を行う.英語文に対しては大文字の小文 字化を行う.また,句読点の前にスペースを入れる. 前処理を行った後の対訳文の具体例を表[*]に示す.

手順2
intersectionを用いたフレーズテーブルの作成

手順1で抽出した対訳文を用いてフレーズテーブルを作成する.作成時のパラメー タにはintersectionを用いる.作成したフレーズテーブルの例を表[*]に示す.


表: パラメータintersectionで作成したフレーズテーブルの例
=0.01cm \scalebox{0.85}{
\begin{tabular}{l}
\hline
\hline
オーバー コート を 脱ぎ捨て $\...
...rt$\ 0.0416667 6.7781e-07 0.0833333 4.50333e-11 \\
\hline \hline
\end{tabular}}


手順3
手作業で作成した翻訳対への翻訳確率値を付与

手順2で作成したフレーズテーブルを参照して,手作業で作成した翻訳対に翻訳 確率値を付与する.翻訳対が``オーバー コート を 脱ぎ捨て flung his coat off''の場合は1行目のフレーズ対の翻訳確率値``0.5 3.88199e-08 0.5 6.46865e-06 ''を付与する.

手順4
grow-diag-finalをもちいたフレーズテーブルの作成

手順1で抽出した対訳文を用いてフレーズテーブルを作成する.作成時のパラ メータにはgrow-diag-finalを用いる.作成したフレーズテーブルの例を表 [*]に示す.


表: パラメータgrow-diag-finalで作成したフレーズテーブルの例
=0.1cm \scalebox{0.99}{
\begin{tabular}{l}
\hline \hline
に オーバー コート を $\vert\v...
...rt\vert\vert$\ 0.25 0.322034 0.0333333 0.197333 \\
\hline \hline
\end{tabular}}


手順5
フレーズテーブルの追加

手順4で作成したフレーズテーブルに,手順3で作成した翻訳確率を付与した翻訳 対を追加する.


表: 確率値を付与した翻訳対を追加したフレーズテーブルの例
=0.1cm \scalebox{0.87}{
\begin{tabular}{l}
\hline \hline
に オーバー コート を $\vert\v...
...rt$\ 0.0416667 6.7781e-07 0.0833333 4.50333e-11 \\
\hline \hline
\end{tabular}}


尚,本稿では,手順4で作成したフレーズテーブルを用いた翻訳をベースライン と呼び,手順5のフレーズテーブルを用いた翻訳を提案手法と呼ぶ.



Jin'ichi Murakami 平成22年9月2日