おわりに

従来手法では,大量の対訳文から対訳句を自動抽出した. 自動抽出により,対訳句を手動で作成する場合に比べコストが低く,大量の対訳句を抽出した. しかし,対訳句の翻訳精度はまだ低い. その原因の一つは,変数が複数の対訳文パターンにあると考えられる.

そこで,対訳句の抽出精度の向上を目指し,変数が1つの対訳文パターンを対訳句の抽出に用いた. 実験結果より,提案手法は対訳句の抽出精度が高いことがわかった. しかし,抽出数は従来手法に比べ非常に少なくなった. これを受け,変数が1つの対訳文パターンを用いて抽出した対訳句に基づき,対訳文パターンを作成することで対訳句の抽出数の増加を試みた. 最終的に,ある程度の抽出精度を維持しながら,抽出数を増加させることができた.

提案手法による対訳句の抽出数では,未だ実用的ではない. 今後は,対訳句の抽出をさらに繰り返すことや,変数が2つの対訳文パターンを用いて,対訳句の抽出を行うなどして,抽出数を増加させることを考える必要がある.



Subsections