鳥バンクは重文複文コーパスから抽出した対訳句対であるので,重文複文コーパスとの親和性が高く,翻訳精度が向上しやすいのではないかと考える. 一方,英辞郎は辞書のデータであるので,重文複文コーパスとの親和性が低く,翻訳精度の向上の幅が小さいのではないかと考える.
ところで,対訳句コーパスに含まれる動詞句に着目すると,鳥バンクの日本語句は終止形で終わるだけでなく,活用しているものも含まれる. 例を表に示す.
日本語句 | やっと そこ に 着い |
英語句 | I finally arrived |
日本語句 | とても 緊張 し |
英語句 | am very nervous |
日本語句 | 酒 を 飲ん |
英語句 | drinking |
一方,英辞郎の日本語句は終止形で終わる動詞が多い. 例を表に示す.
日本語句 | セカンド ・ オピニオン を 求める |
英語句 | ask for second opinions |
日本語句 | カーテン を 引く |
英語句 | draw a curtain |
日本語句 | 外 へ 伸ばす |
英語句 | run out |
そのため,翻訳精度に差が出た可能性がある. そこで,英辞郎の動詞句を活用させ,翻訳実験を行う.