例1)係り受け構造の異なる複数の文型パターンに一致する例
→ .past, saying had .past.
→ The catcher appealed, saying the batter had swung.
→ (|
I) .past that .pft .
→ The batter appealed that the batter had swung the catcher. (不適切)
例2)主節の述部の意味によって訳し分けるべき複数の文型パターンに適合する例
→ It is clear to by .reflex.
→ It is clear to take that responsibility by myself.
→ (|
I) .ing.
→ I clear taking that responsibility by myself. (不適切)
そこで,被覆率を「再現率」と「意味適合率」に分けて評価する.但し,「再現率」は,「入力文の何パーセントに対して適合文型パターンが存在するか」を表し,「意味適合率」は,「適合文型パターンのうちどれだけの文型パターンが意味的に正しいか」を表す.
このうち,まず,「再現率」の評価方法であるが,文型照合プログラムは,入力文と文型パターンとの照合において,当該文型パターンのすべての要素が指定された順に出現するような入力文である時,その文型パターンを適合文型パターンと判定する.すなわち,ある文型パターンが入力文との照合に成功するには,文型パターンで指定された要素がすべて入力文に存在しなければならないが,逆に,入力文のすべての要素が文型パターンで指定されている必要はない.そこで,適合文型パターンを以下の2種類に分類する.
下記に入力文に「完全一致」する文型パターンと「部分一致」する文型パターンの例を示す.
例)入力文に「完全一致」又は「部分一致」する単語レベル文型パターンの例
入力日本文:「その飛行機は荷物を積み残して出発した。」
<完全一致する文型パターン>
Wn:は単語レベルの文型パターン,Pnは句レベルの文型パターンを意味する.
(W1) | / | は/ | を/ | 積み残して/ | .kako。 |
その | 飛行機は | 荷物を | 積み残して | 出発した。 | |
→ .past before some could board. |
(W2) | #1[]/ | は/ | #4[の]/ | を/ | て/ | .kako。 |
その | 飛行機は | 荷物を | 積み残して | 出発した。 | ||
→ #1[] be.past .ed by .ing #4[] . |
(P1) | は/ | を/ | #3[大きく]/ | て/ | .kako。 |
その飛行機は | 荷物を | 積み残して | 出発した。 | ||
→ With of .poss .pron .past. |
(P2) | <は>/ | て/ | .kako。 |
その飛行機は | 荷物を積み残して | 出発した。 | |
→ ( I) .past and .past. |
<部分一致する文型パターン>
文型パターンに存在しない入力文の要素を《 》の記号で示す.
(W1) | / | は | / | て/ | .kako。 |
その | 飛行機は | 《荷物を》 | 積み残して | 出発した。 | |
→ be .past .ed and . |
(W2) | #1[]/ | は/ | #4[の]/#6[]/ | を | / | .kako。 |
その | 飛行機は | 荷物を | 《積み残して》 | 出発した。 | ||
→#1[] .past #6[] #4[of the ]. |
(P1) | は/ | / | .kako。 | |
その飛行機は | 荷物を積み残し | 《て》 | 出発した。 | |
→ .past and .past. |
(P2) | / | て/ | .kako。 | ||
その飛行機 | 《は》 | 荷物を積み残して | 出発した。 | ||
→ .past for .ing. |
このように,適合文型パターンだとは言え,必ずしも入力文のすべての要素に対して解釈を与えるものではないから,適合文型パターンについて,それが入力文の何%をカバーしているか(入力文カバー率)が問題となる. そこで本稿では,「再現率」を,「入力文単位で見た再現率」を意味する「文型再現率」と「入力文の文字単位で見た再現率」を意味する「文型一致率」の2つのパラメータを使用して評価する.
次に,「意味適合率」であるが,適合した文型パターンには,すでに述べたように,対応する英語文型パターンが翻訳に使用できるものと,そうでないものが存在するため,翻訳に使用できる文型パターンを選択する方法が問題となる. そこで,ランダムに選択する場合(最悪の場合)ともっとも適切なものが選択できた場合(最良の場合)を考え,評価では,「適合した文型パターンの一つ一つが意味的に正しいかどうか」を表す「適合文型意味正解率」と「1入力文に適合した文型パターン(1つ以上)の中に意味的に正しい文型パターンが1つ以上含まれる割合」を示す「適合文型正解含有率」を評価パラメータとして使用する.
以下,「再現率」と「意味適合率」を評価するためのパラメータの計算方法を示す.