表21の内訳において,評価値3(107件)の誤り分析を行う.原因は,英
語パターン表記が不十分であった場合が54件(約50%),日英の辞書引きで失敗
した場合が28件(約26%),尤度により正しくない単語を選択した場合が25件(約
23%)であった.
(英語パターン表記が不十分な場合の例)
入力文:彼女は田舎に子どもを残して来た。
英語パターン: have left behind in .
出力:She have left her children behind her in country.
動詞``have''は字面表記であるため(下線部),活用形の変形ができない.
(日英辞書引きで失敗)
辞書引きの失敗の内訳は,辞書引きの結果が間違っていた場合が20件,辞書に
登録されていない場合が8件あった.
(尤度による選択で正しくない単語を選択した例)
入力文:事件が漏れて世間の評判になっている。
英語原文:The affair has got wind, and is the talk of the town.
出力:Events have fallen , and is rumor of people .
出力は,単数,複数の整合が取れていないため誤訳と判断され,評価値
3となった.しかし,候補には``Events''の他に``Event,jincident,
affair''があり,``have''の他に``has''もあった.単数形
が選択されると,評価値4になると考えている.
クロスバリデーションテストおよびオープンテスト
文型パターンは,被覆率を確保するために,日本語パターンにさまざまな汎化
を行っている[7].しかし,その汎化が英語パターンに反映されて
いない記号があり,その記号の英訳は現状では困難である.クロスバリデーショ
ンテストおよびオープンテストでは,英語パターンに反映されていない記号に
多くの日本語が適合してしまい,ITMの出力英文に情報が欠落している場合が多
かった.例を以下に示す.
入力文:株価が急落したために市場が混乱している。
日パターン:/ #1[ の] #3[^] /
が #6[] 。
英パターン:#1[()] #3[] #6[()].
バインド値:/=株価が急落したために,=市場,=混乱し
出力:Market snarl .
日本語パターンの``/''は連用節が適合する記号である.例では,``株価が
急落したために''が``/''に適合する.日本語パターンにある``/'',
``/''などの記号は英語パターンには反映されておらず,翻訳規則が確立さ
れていないため,現状で英訳はできない.