next up previous contents
次へ: 単語選択の問題点 上へ: 考察 戻る: 考察   目次

対訳データの問題点

重文複文を翻訳する場合,学習データに重文複文を用いたとき,出力文は意味が理解 できる文が少なかった.この原因について,次のように考えている.対訳データ において,日本語文が重文複文であっても,英語文は意訳され単文となっているこ とが多い.そのため,正しいフレーズ対が生成されず,意味が理解できない文が 多く生成された.例を以下に示す.

問題のある重文複文の対訳:日本語コーパス
それ は ありふれ た 話 だ 。
彼 は 愛車 を 駆っ て 横浜 へ 行っ た 。
ウオツカ は ちびりちびり 飲ま ない で 一気に あおる ん だ 。
ぼく は 女の子 の 前 に 出る と すぐ あがっ て しまう 。
彼 は 悪意 が あっ て 言っ た の で は ない 。
うそ を つく こと は いや しむ べき 悪徳 で ある 。
批評 家 は てい の いい 揚げ足 取り だ 。

問題のある重文複文の対訳:英語語コーパス
It is an old story .
He drove his car to Yokohama .
Do not sip your vodka .
I am very nervous around girls .
He did not mean any harm .
Lying is a despicable vice .
A critic is a virtual faultfinder .



平成20年3月25日