next up previous contents
次へ: 謝辞 上へ: 080318 戻る: 辞書適用前と適用後の比較   目次

おわりに

現在,約12万件の重文複文を対象として,日英機械翻訳における重文複文の表現構造を 解析するための日英重文複文文型パターン辞書が作成された.

しかし,そのうちの節や句の表現を翻訳するためのパターンは不十分であり,節と句 の表現構造を解析するためのパターン辞書はまだ作成されていない. 日英重文複文文型パターン辞書は節,句,単語の3つのレベルのパター ンを用いて構成されており, 節と句の表現構造に関する記述は日英重文複文文型パターン辞書のパ ターンの中に含まれており, よって,これらの記述を用いることで節と句を対象としたパター ン辞書が作成できると考えられる.

本研究では,重文複文パターン日英重文複文文型パターン辞書から節と句に関する記述を抽 出し,その記述を用いて節と句のパターン辞書を構築した.抽出の際には変数に ついて記述されたVarListと呼ばれるファイルを使用して,機械的に抽出を行っ た.次に,構築した節と句のパターン辞書をITM[3]への実装を行った. 実装したシステムにおいて日英重文複文文型パターン辞書から抽出した日英 文対100件を用いて,Closedテストを行った結果,BLEUスコア [5]が辞書適用前で0.39,辞書適用後で0.51となり, 翻訳精度の向上を確認し,節と句のパターン辞書が有効であることが示された.

今後の課題として,パターンの縮退性の調査,日本語と英語側で句の種類が違う 場合のパターン辞書の作成,人手による評価(Closedテスト,Openテスト)が必要である.



平成20年3月21日