next up previous contents
Next: 提案手法2(Dice係数と類似度の積())を使用する手法 Up: 提案手法 Previous: 概要   目次

提案手法1(フレーズ確率の総積($P_2$)を使用する手法)

提案手法1はフレーズ確率の総積($P_2$)を用いる手法である. フレーズ確率の総積$P_2$は同一パターンの変数部のフレーズ確率$P_1$の総積である. 計算式を式3.1に示す.
$\displaystyle P_2(X_i) = \sum_{i=0}^W P_1(x_i)$     (3.1)

$W$;変数の数
以下に例を示す.表3.1に対訳句作成時に使用するデータの具体例を示す.

表 3.1: 対訳学習文テストデータ
\scalebox{0.97}{
\begin{tabular}{\vert c\vert c\vert} \hline
対訳学習文(日...
...3 \\ \hline
対訳文パターン(英) & $X$1 $X$3 $X$2 \\ \hline
\end{tabular}}


3.1の対訳学習文は対訳句作成に用いる文である. 対訳文パターンは対訳句作成に用いるパターンである. 対訳句作成の手順を以下に示す.

手順1
対訳学習文とパターンを照合
手順2
単語レベル文パターンの変数部に対応する組み合わせの対訳句をすべて抽出
3.2に抽出した対訳句の具体例を示す.


表 3.2: 手順2と手順3の具体例
\scalebox{0.82}{
\begin{tabular}{\vert c\vert c\vert c\vert c\vert} \hline
変...
...& -0.1 \\ \hline
$X$3 & 作られる & is made & -0.05 \\ \hline
\end{tabular}}


手順3
式を用いて対訳句にフレーズ確率を付与
3.2に示しているフレーズ確率は対数値である.フレーズ確率の総積はパターンにおける変数部のフレーズ確率の総積である. ここで,フレーズ確率の総積は1つの変数の組から作成された対訳句において同じ値となる. 表3.2におけるフレーズ確率の総積の計算式を式3.2に示す.


$\displaystyle P_2(\frac{この箱}{this\ box})
\hspace{-8zw}$      
  $\textstyle =$ $\displaystyle P_1(\frac{この箱}{this\ box}) * P_1(\frac{木より}{from\ wood}) * P_1(\frac{作られる}{is\ made})$  
  $\textstyle =$ $\displaystyle 2^{(-0.4)} * 2^{(-0.1)} * 2^{(-0.05)} = 2^{(-0.55)}=0.683$  
  $\textstyle =$ $\displaystyle P_2(\frac{木より}{from\ wood}) =P_2(\frac{作られる}{is\ made})$ (3.2)

最終的なフレーズ確率の総積は全てのパターンと対訳文におけるフレーズ確率の総積の再良値となる.



2018-03-06