自動対訳句の作成

対訳句を自動で作成する手法として,対訳文とその対訳文から自動で作成した対訳文パターンを用いる手法がある. 具体的には,まず,GIZA++[16]を用いて,対訳単語を作成する. 次に,その対訳単語と対訳文を用いて対訳文パターンを作成する. そして,対訳文と対訳パターンを用いて対訳句を作成する.

以下,自動対訳句の作成過程における各手順について記述する. startsectionparagraph4@1.0plus.5minus.2.1plus.3 対訳単語の作成 GIZA++を用いて対訳単語を作成する. 対訳単語作成の手順を以下に, 例を図4に示す.

手順1
GIZA++を用いて対訳文から日英方向と英日方向の単語対応を得る.
手順2
単語対応より対訳単語を得る.
手順3
日英方向と英日方向の単語の翻訳確率を掛け合わせ,対訳単語の翻訳確率(以下,
  対訳単語翻訳確率と呼ぶ)を得る.
手順4
対訳単語翻訳確率が一定の閾値(38#38)以上である対訳単語を抽出する.

図: 対訳単語作成の例
39#39

startsectionparagraph4@1.0plus.5minus.2.1plus.3 対訳文パターンの作成 対訳単語と対訳文を用いて対訳文パターンを作成する. 対訳文パターンの作成の手順を以下に,例を図5に示す.

手順1
4.1.2.1節で抽出した対訳単語が対訳文中で適合した場合,変数化を行い,対訳文パターンを得る.
手順2
対訳文パターンの英語側において,変数の直前に冠詞がある場合,冠詞を除去する.

なお,変数が連続しない対訳文パターンのみを本研究で用いる対訳文パターンとする.

図: 対訳文パターン作成の例
40#40

startsectionparagraph4@1.0plus.5minus.2.1plus.3 対訳句の作成 対訳文と対訳文パターンを用いて対訳句を作成する. 対訳句の作成の手順を以下に,例を図6に示す.

手順1
対訳文と対訳文パターンを照合する.
手順2
対訳文が対訳文パターンに適合した場合,対訳文パターンの変数部に対応する対を対訳句として抽出する.

図: 対訳句作成の例
41#41