next up previous contents
次へ: 文型パターンパーサ 上へ: 文型パターン辞書の問題点 戻る: 使用される可能性が低い表現   目次

過剰汎化文型パターン

以下で示すような,過剰に汎化された文型パターンが存在する問題がある.

日本語文:
ニッコリ笑って承知した。
日本語文型パターン:
/y </tk $N1$ は> #2[/cf $V3$ て] /ycf ($V4$.kako|$ND4$ をした) 。
英語文:
She smiled her consent.
英語文型パターン:
<She|$N1$> $V3$^past <her|$N1$> N($V4$|$ND4$).

このような日本語文型パターンは,任意記号内に動詞の1つが記述されているため,単文にも適合する. また,日本語文型パターン中の離散記号(/y)は,連用節に適合する. そのため,多くの入力文が,これらの日本語文型パターンに「連用節+単文」の形で適合したと考えられる.

しかし,本研究で扱う文型パターン辞書は本来,重文・複文を対象としている. したがって,これらはパターン作成中に過剰に汎化されたと言わざるを得ない.

このような,過剰汎化された文型パターンを削除することで, 文型パターン辞書の精度が向上できるのではないかと考えられる.



平成19年3月1日