next up previous contents
次へ: 抽出例 上へ: 格要素パターン辞書の作成 戻る: 扱う格助詞と前置詞   目次

作成方法

「日本語表現意味辞書(重文複文編)」の日文英文パターン対から 格要素パターン対を機械的に抽出する手順は次のとおりである.
  1. 日文パターンより格助詞を検索する.
  2. 格助詞の前の名詞変数からの表現,後の文節境界までの表現がある場合,それ を格助詞相当句とみなして記憶する.
  3. 格助詞または格助詞相当句の直前に名詞変数があるならば,その変数を 記憶する.
  4. (2) と (3) より変数から格助詞もしくは格助詞相当句の終わりまでを格要 素パターンとみなす.
  5. 英文パターンより,同一変数を検索する.
  6. (5) の変数の直前に前置詞または前置詞相当句があるならば,それと変 数をあわせて前置詞句パターンとみなす.
  7. (4) の格要素パターンと (6) の前置詞句パターンを対にすることで,格 要素パターン対を得る.

ここで,検索に失敗したり,変数や前置詞等が 存在しない場合,格要素パターン対は得られない.また,変数を扱う際, 変数の直後の制約を変数とともに抽出し,パターンに組み込むこととす る.制約は「OR:...」より字面レベルでの条件記述がなされている. 格要素パターン辞書には,用例レベル格要素パターン対を登録する.しかし,表 現の広がりを調べるために,文法レベル格要素パターン対も集計する. その例を図3.2に示す.

図 3.2: 格要素パターン対のレベル
\begin{figure}\centering
\begin{tabular}{p{38zw}} \hline
用言レベル格要素パター..
...ハヘラチヌ・ム・ソ。シ・鸞从\\
$N_k$ で   by $N_k$\\
\hline
\end{tabular}
\end{figure}


平成22年2月11日