next up previous contents
次へ: 諸般の問題 上へ: 考察 戻る: 局所翻訳の可能性の検証について   目次

結合価パターンの有効性の検証について

queenの翻訳実験において,評価が◎または○となった正解となる事例数は,全 体の68%(221/325)であった.よって,現段階では結合価パターンは68%有効 性があると言える.
    本研究は,翻訳プロトタイプの第一段階であり,4.4節の結果で述べたよ うに.今後さらに改良の余地があると思われる.そのため,第一段階としては, 良い結果だったと言える.
    以下では,評価が正解とならなかった計104件を分析する.
    分析の結果,動詞句の翻訳においては,結合価パターンで実装されてい る格要素と動詞の関係だけでは判断できない非線形と思われるものには,以下 のものがあった.
  1. 格要素がなく,「副詞+動詞」で表されている場合
  2. 格要素が足らない場合
  3. 1でも2でもなく,動詞だけで適合した場合
  4. 格要素が複雑である場合
  5. 入力動詞句が「AをBにする」構文である場合
  6. 消去すると意味を失う構文
  7. 変数に誤った単語が代入された場合
  8. 再帰代名詞の変数が残っている場合
  9. 主語となる変数に適合した場合
  10. 結合価パターンに存在しない場合
  11. 意味属性制限ミス
その具体例を以下に示す.
  1. 格要素がなく,「副詞+動詞」で表されている場合
    格要素がないので,うまく訳出できない.
    例1)
        入力動詞句:うまく行く。
        理想解:go well
  2. 格要素が足らない場合
    パターンには存在する格要素となる変数が入力動詞句にない場合,変数 がそのまま残ってしまう.
    例)
        入力動詞句:北に変わる。
        理想解:shift to the north
        適合パターン(日;英):$N1$(*)が $N2$(*)から $N3$に (*) 変わる。;$N1$ change from $N2$ to/into $N3$
        出力結果:@change from ($N2$) to/into north
        代入値:$N3$=北→north
    また,この場合において,足らない格要素が目的語であった場合
    例)
        入力動詞句:型紙に合わせる。
        理想解:fit the pattern
        適合パターン(日;英):$N1$(3主体)が $N2$(533具体物 2306物象)を $N3$(2306物象 2488性格 533具体物)に/と 合わせる。; $N1$ match $N2$ with $N3$
        出力結果:@match ($N2$) with pattern
        代入値$N3$=型紙→pattern
    英語の動詞が他動詞であるにも関わらず,入力文に該当格要素が 存在しなかった.つまり,「合わせる」の目的語の情報がない.これ は,英文生成時の問題と言うこともできる.
  3. 1でも2でもなく,動詞だけで適合した場合
    格要素は関係なく,動詞だけ結合価パターンと適合してしまったものが あった.
    例)
        入力動詞句:ダムの構造と水の重量に左右する。
        理想解:depend on the weight of the structure and of the water on the dam
        適合パターン(日;英):$N1$(*)が $N2$(*)を 左右す る。;$N1$ influence $N2$
        出力結果:@influence ($N2$)
    「ダムの構造と水の重量に」の部分が全て離散記号と適合してしまった.
  4. 格要素が複雑である場合
    例)
        入力動詞句:異なる字体の文字グラフィッ クスまでも出力できる。
        理想解:are capable of producing characters in different type fonts and even graphic output
        この場合は,格要素が複雑であるため,「$A$ を出力できる = are capable of producing $A$」というパターンがあったとしても,訳出は 難しい.
  5. 入力動詞句が「$A$$B$にする」構文である場合
    $A$$B$にする」は,「make $A$ $B$」という対訳の結合価パターン を持つ.入力動詞句が「$A$$B$にする」構文の時,3.3節の翻訳手順 の「照合による選択」により,全て「make $A$ $B$」という出力結果に なってしまう.
    例)
        入力動詞句:足に怪我をする。
        理想解:hurt my leg
        適合パターン(日;英):$N1$(3主体)が $N2$(*)を $N3$(*)に/と する。;$N1$ make $N2$ $N3$
        出力結果:@make accident foot
        代入値:$N2$=怪我→accident,$N3$=足→foot
  6. 消去すると意味を失う構文
    本稿では,3.2節の補語の削除において,入力動詞句と適合 しない残った変数が補語であれば,消去している.しかし,消去するこ とによって本来の意味を失う構文がある.
    例)
        入力動詞句:日よけを上げる。
        理想解:put up their sunshade
        適合パターン(日;英):$N1$(4人)が $N2$(533具体物 3 主体)を $N3$(“リスト/上” 875屋根)に 上げる。;$N1$ put $N2$ on $N3$
        出力結果:@put sunshade
        代入値:$N2$=日よけ→sunshade
    この例は,「put $A$ on $B$」で初めて「上げる」という意味になる.今後, 何とか動詞の判定を行う必要がある.
  7. 変数に誤った単語が代入された場合
    queenが格要素の字面を誤って認識していて,変数に誤った単語が代入さ れてしまう.
    例)
        入力動詞句:写真をテーブルの上に並べる。
        理想解:line the photos out on the table
        適合パターン(日;英):$N1$(3主体 962機械)が $N2$(4 人 389施設 533具体物)を $N3$(388場所 533具体物 2610場)に/へ 並べ る。;$N1$ arrange $N2$ on/in $N3$
        出力結果:@arrange photograph on/in head
        代入値:$N2$=写真→photograph,$N3$=上→head
    本来,$N3$には「テーブル」があたるべきである.
  8. 再帰代名詞の変数が残っている場合
    入力動詞句だけでは判断不可能で,変数が残ってしまう.
    例)
        入力動詞句:人間に化ける。
        理想解:take the shape of a human being
        適合パターン(日;英):$N1$(533具体物)が $N2$(533具 体物)に 化ける。;$N1$ disguise $N1$-self as $N2$
        出力結果:@disguise ($N1$)-self as human being
        代入値:$N2$=人間→human being
        この場合は,格要素と述語の関係だけで決定することができない.ま た,この問題は,局所翻訳の可能性の問題でもある.つまり,$N1$-self の訳出は,主語の情報が必要である.動詞句の翻訳でも,主語を入力す る必要がある.
  9. 主語となる変数に適合した場合
    queenでは,3.1.1節の結合価パターンの句形成において, 主語となる変数は削除している.よって,主語となる変数に適合した情 報は,削除されてしまう.
    例)
        入力動詞句:他の鋳鉄とは含有グラファイトの形状が異な る。
        理想解:differ from other cast irons in the shape of the contained graphite
        適合パターン(日;英):$N1$(*)が $N2$(*)と 異なる。; $N1$ be different from $N2$
        出力結果:@be different from cast iron
        代入値:$N1$=形状→shape,$N2$=鋳鉄→cast iron
        主語に該当する変数に日本語動詞句の一部が適合しているが,主 語は消去するため,出力では主語の部分の情報が失われる.
  10. 結合価パターンに存在しない場合
    結合価パターンに存在しないため,うまく適合しない.内訳は以下の通 り.
    主動詞が「名詞+する」である場合,主動詞が複合動詞である場 合,結合価パターンにない動詞の場合
  11. 意味属性制限ミス
    内訳は以下の通り.
    意味属性制限がうまくいかない場合,意味属性制限がかかり過 ぎて適合するパターンがない場合
参考として,動詞と格要素の関係において,判別できるはずのものは, 104件中73件であった.queenのパターンの照合条件の修正,結合価パター ンの追加,意味属性制約への柔軟な対処が求められる.これが実装でき れば,結合価パターンの有効性が約90%まで上がると考えられる.
    また,結合価パターンで表現できない非線形構造については,別途パター ン化する必要が考えられる.


next up previous contents
次へ: 諸般の問題 上へ: 考察 戻る: 局所翻訳の可能性の検証について   目次
平成17年4月14日