文型パターンは, 日英対訳標本文を, 変数化および関数化, 任意化している. その中で単語レベル文型パターンは, 表現に使用される名詞,動詞などの自立語 の線形な表現要素を変数化している. また, 変数化すると対訳の訳出が困難にな る部分は非線型な表現要素として字面、あるいは関数の形式で残されている.単 語レベル文型パターンの例を以下に示す.
変数には名詞や動詞の変数を表すやなど8種類がある. 関数には やなどがあり, 字面の指定や表現を指定している. 記号は, パター ン記述要素の受理の仕方について, 任意化, 選択および順序変更などの制御を行 う.
記号名 | 表記 | 意味 |
離散記号 | / | 文型に無関係な要素 |
選択記号 | (…|…) | いずれかの要素列と受理 |
任意記号 | […] | 文型選択上, 任意の表現要素 |
補完要素記号 | <…> | ゼロ代名詞など |
順序任意要素 | {…|…} | 順序入れ換え可能な範囲 |
指定記号 | (例 各要素の順序) | |
位置変更可能 | $n^{…定義…} $n |
指定位置に入れ換え可能 |
要素指定記号 | (例 副詞の位置) | |
文節境界記号 | 文節境界と受理 | |
記憶記号 | #n | 受理内容を記憶 |
本研究では, [2]の文型パターン辞書のうち文法・単語レベルの文型パターン辞 書(122,619パターン)を調査対象とする. この辞書を用いて選択記号の効果を求 めるために, 新たな単語レベル文型パターン辞書を作成する.