next up previous
次へ: 排他性の評価 上へ: 文型パターン記述方式と被覆率の関係 戻る: 任意要素指定機能の効果

時制・様相などの縮退効果

単語レベルの文型パターン化において,時制,相,様相の表現は原則として関数化されているが,「文型任意要素」としての指定は行われていない.文型パターンの照合段階での時制変形,相変形,様相変形などの操作を認め,そのような変形が可能な関数を「文型任意要素」として指定すれば,文型パターンの汎用性は大幅に向上することが期待される.そこで,現在使用されている時制,相,様相の関数を無視した場合,文型被覆率がどのように変化するかを調査した[*]

この実験は,文型パターン照合プログラムの照合条件を以下のように変更することによって行った.すなわち,入力文内の述語末尾の助詞,助動詞が,文型パターン内の時制,相,様相を表す関数の条件を満たさなくても文型パターンは適合したものと判定した.これにより,例えば,下記の文型パターンとの照合では,$AJ5$の末尾に .hiteishushi.souda に適合する表現がなくても,入力文は文型パターンに適合したものと判定される.


例)$N1$が/不便なため、/$N2$の/$N3$は/#4[あまり]/$AJ5$[.hiteishushi.souda]。

(適合する入力文の例)交通が不便なため,土地の値段はあまり高くないそうだ。
【説明】入力文は,文型パターン末尾の関数部分``.hiteishushi.souda''の適合条件を満たさなくても良いとすることにより,入力文の文末が,「高くない」,「高い」,「高かった」,「高くなかった」,「高いようだ」,等多くの場合に適合するようになる.


実験では,文型パターンの作成で使用した12.9万件の日本文(「母集団試験文」)を入力文として,単語レベルの文型パターン辞書12.2万件と照合し,文型再現率を求めた.その結果を表12に示す.また,文型一致率と適合文型パターン数の平均を表13に示す.


1.5
表 12: 時制・相・様相の縮退効果(単語レベル)
条件 完全一致 部分一致 文型再現率($R1$) 文型一致率($R2$)
削除前 14.4% 50.3% 64.7% 42.08%
削除後  6.6% 91.8% 98.4% 64.49%


1.5
表 13: 文型一致率($R2$)と一致文型数平均
条件 一致文型パターン数平均 / 入力文 適合文型パターン
  異なり文型パターン数 延べ文型パターン数 当たりの解釈の数
削除前 9.45件 22.92件 2.43
削除後 73.5件 255.8件 3.48

12,表13の「削除前」は現状の文型パターンの場合を示すが,その値は,表7の値と若干異なる値となっている.これは,テストに使用した入力文が異なるためである(いずれも「母集団試験文」であるが,テスト文は,表7の場合1万文,表12,表13の場合12.9万文).

12から,時制,相,様相の削除によって,「完全一致率」は大きく減少する[*]が,「部分一致」が大幅に増えて,100%近い「文型再現率$R1$」になり,被覆率向上で大きな効果が期待できることが分かる.また,表13からは,削除後の「文型一致率$R2$」は1.5倍程度に向上するが,その反面,1入力文に対する適合文型パターン数とその解釈の数は10倍程度に増加することが分かる.

これらのことから,今後,任意化により,時制,相,様相の情報を極力縮退させることができれば大きな効果が期待される.しかし,その場合は,不適切な適合文型パターンも大幅に増大することが確実である.時制,相,様相の情報は,対応する英語文型パターンを決定する上で重要な情報であり,非線形要素となる場合も多いと予想される.任意化の可否判定規則を検討することにより,不適切な文型パターンへの適合が抑止できるように改良することが大切だと考えられる.



平成16年11月17日