次へ: 抽出例
上へ: 格要素パターン辞書の作成
戻る: 扱う格助詞と前置詞
目次
「日本語表現意味辞書(重文複文編)」の日文英文パターン対から
格要素パターン対を機械的に抽出する手順は次のとおりである.
- 日文パターンより格助詞を検索する.
- 格助詞の前の名詞変数からの表現,後の文節境界までの表現がある場合,それ
を格助詞相当句とみなして記憶する.
- 格助詞または格助詞相当句の直前に名詞変数があるならば,その変数を
記憶する.
- (2) と (3) より変数から格助詞もしくは格助詞相当句の終わりまでを格要
素パターンとみなす.
- 英文パターンより,同一変数を検索する.
- (5) の変数の直前に前置詞または前置詞相当句があるならば,それと変
数をあわせて前置詞句パターンとみなす.
- (4) の格要素パターンと (6) の前置詞句パターンを対にすることで,格
要素パターン対を得る.
ここで,検索に失敗したり,変数や前置詞等が
存在しない場合,格要素パターン対は得られない.また,変数を扱う際,
変数の直後の制約を変数とともに抽出し,パターンに組み込むこととす
る.制約は「OR:...」より字面レベルでの条件記述がなされている.
格要素パターン辞書には,用例レベル格要素パターン対を登録する.しかし,表
現の広がりを調べるために,文法レベル格要素パターン対も集計する.
その例を図3.2に示す.
図 3.2:
格要素パターン対のレベル
|
平成22年2月11日