next up previous contents
次へ: distortion-limitの影響 上へ: 考察 戻る: 自動評価と対比較評価の不整合   目次

未知語の影響

本研究では,市販されている翻訳ソフトを用いるため,翻訳ソフト固有の辞書デー タを利用している.したがって,統計翻訳のみのときと比較して,未知語の大幅な減少が 考えられる.よって,未知語に関して調査を行なった. 未知語が減少した例を表17に示し,それぞれの未知語数を表18に示す.



表 17: 未知語の減少例
例1(単文)
日本語文 その 食事 は オードブル で 始まっ た 。
正解文 The meal opened with hors d'oeuvres .
ベースライン The meal began with the オードブル .
提案手法1 The meal began with the hors-d 'oeuvre .
例2
日本語文 組み合わせ は 籤 で きめ られ た 。
正解文 The pairing were drawn by ballot .
ベースライン The combination きめ in 籤 .
提案手法1 The combination was determined by lot .
例1(重文複文)
日本語文 ちゃんと 縛っ て おけ ば ちゃんと 見つかる 。
正解文 Safe bind , safe find .
ベースライン If you can 縛っ properly properly .
提案手法1 I have found it binds properly .
例2
日本語文 人 が ごく 近く に 来る まで ウズラ は 隠れ 場 に ひそん で いる 。
正解文 A quail will remain in its cover until one draws very near .
ベースライン ウズラ is hiding in the very near to some people .
提案手法1 The quail lurks in the hiding place till I call so that are very close .


表 18: 未知語数の比較
  単文 重文複文
  総数
ユニーク数
総数
ユニーク数
ベースライン 3914
3480
4020
3576
ATLASのみ 379
346
518
443
提案手法1 310
297
370
348
翻訳の王様のみ 665
588
770
642
提案手法2 446
429
492
461

結果より,ベースラインと比較して,提案手法1と提案手法2の両方において,未 知語の大幅な減少が確認できた.また,ルールベース翻訳のみと比較しても,提案手法1と提案 手法2の両方において,未知語の減少が確認できた. よって,未知語の減少が翻訳精度の向上に影響していると考えられる.
しかしながら,ルールベース翻訳のみと提案手法の未知語数では大きな差はない.そ れにも関わらず,提案手法では,ルールベース翻訳のみと比較して,BLEUスコアが大きく向上 していることから,BLEUスコアに対する未知語の影響は小さいものであると考えられる.


next up previous contents
次へ: distortion-limitの影響 上へ: 考察 戻る: 自動評価と対比較評価の不整合   目次
平成22年2月11日