next up previous
次へ: 時制・様相などの縮退効果 上へ: 文型パターン記述方式と被覆率の関係 戻る: 文型パターン記述方式と被覆率の関係

任意要素指定機能の効果

文型パターンの記述で使用される「任意要素」は,「原文任意要素」(「離散記号」で指定)と「文型任意要素」(「省略記号」で指定)に分けられる.

前者は,任意の文型要素が存在しても良い位置を表すものである.該当する位置に現れた入力文の要素は,別途翻訳して英文に組み込まなければならないが,組み込むべき位置を知るためには構文解析処理などが必要である.これに対して,後者は,英文中に訳出すべき位置情報が指定されているため,該当する部分の翻訳を組み込むことは容易である.いずれも,単語レベル,句レベルの文型パターンの被覆率向上を目指したものである.

そこで,文型パターンの定義において,これらの要素の指定機能によってどれだけの汎化効果が得られたかを評価するため,任意要素指定機能の有無と被覆率の関係について「母集団試験文」1万件を対象に実験的に調査した.実験では,元の文型パターンに対して例に示すような変更を加えた辞書を使用した.


例)任意要素を削除した文型パターンの例

元の文型パターンから,○ 1「原文任意要素(離散記号``/'')」と○ 2「文型任意要素」を削除した文型パターンの例を示す.

<元の文型1>#1[$REN2$]/$N3$$V4$.rareru/のは$N5$しか/いない。

1.1
(参考例文): この事態をおさめられるのは彼しかいない。
○ 1を削除 #1[$REN2$]$N3$$V4$.rareruのは$N5$かいない。
○ 2を削除 /$N3$$V4$.rareru/のは$N5$しか/いない。
○ 1○ 2を削除 $N3$$V4$.rareruのは$N5$しかいない。


<元の文型2>#1[$N1$は]/[$N2$の]/$N3$$V4$.teiru/(うちに|内に)/[$N1$は]/$VP5$.tekuru.kako

1.1
(参考例文): 彼の言い訳を聞いているうちに怒りがこみ上げてきた。
○ 1を削除 #1[$N1$は][$N2$の]$N3$$V4$.teiru(うちに|内に)[$N1$は]/$VP5$.tekuru.kako
○ 2を削除 $N3$$V4$.teiru/うちに//$VP5$.tekuru.kako
○ 1○ 2を削除 $N3$$V4$.teiruうちに$VP5$.tekuru.kako


(凡例)(うちに|内に):「要素選択記号」で,指定された複数要素のいずれかにマッチすることが要求される.
【説明】``#1[$N1$は]''は補完要素記号,``[$N2$の]''は任意要素記号で,いずれも○ 2に該当する.また,``(うちに|内に)''も任意記号の1種であり,○ 2の削除では,選択機能を停止し,第1要素へのマッチのみOKとする.


評価結果を表11に示す.表では,備考欄に上例との対応を示した.


1.5
表 11: 任意要素指定の効果
場合分け 文型再現率($R1$) 備考
離散記号 文型任意記号 単語レベル 句レベル (例との対応)
あり あり 69.8% 89.0% 〈元の文型〉
  なし 47.6% 83.7% 〈○ 2を削除〉
なし あり 15.4% 55.6% 〈○ 1を削除〉
  なし 10.7% 48.7% 〈○ 1○ 2を削除〉

この表から以下のことが分かる.

(1)
「離散記号」(「原文任意要素」)の有無を比較すると,単語レベルでは,この記号の使用によって「文型再現$R1$」は5倍近く向上しており,句レベルでも1.5〜2倍近く向上している.
(2)
「文型任意記号」も被覆率の向上に与える効果は大きいが,単語レベルでは,1.5倍程度,句レベルでは,1.1倍程度で「離散記号」の場合に比べてその効果は少ない.

これらから,「離散記号」は被覆率向上で大きな効果を持つことが分かる.しかし,適合した文型パターンを見ると,確かに,意味的に適切な文型パターンへの適合も増加しているが,不適切な文型パターンへの適合が予想を超えて大幅に増大しているようである.これは,「原文任意記号」が任意の要素の存在を認める意味で使用されていることが原因と考えられる.現状の文型パターンでは,汎用性を向上させるため,入力文が文法的にも意味的にも正しいことを前提に大変緩やかな適用条件とされているが[*],今後は,「原文任意要素」を文法的,意味的に分類し,制約条件を付与すると共に,その挿入位置を見直すことなどにより,間違った文型パターンへの「部分一致」を防止することが大切と考えられる.

これに対して,「文型任意記号」の効果は,今ひとつ少ないように思われる.これは,半自動的な方法で「文型任意要素」の指定が行われているため,字面表記の揺らぎが十分に吸収されていないことが予想される.今後は,徹底した異表記のグループ化を行うと共に,部分的な言い換え表現の辞書を開発することなどが期待される.


next up previous
次へ: 時制・様相などの縮退効果 上へ: 文型パターン記述方式と被覆率の関係 戻る: 文型パターン記述方式と被覆率の関係
平成16年11月17日