next up previous
次へ: 重文と複文の文型パターン化 上へ: 文型パターン化の具体的方法 戻る: 節レベルの文型パターン化の方法

文型パターン化作業の半自動化

半自動化を考慮した作業手順を図1に示す.図1の手順で重要な点は以下の通りである.

(1)
原文の形態素解析情報の準備

 対訳文の形態素解析結果から,文型パターンを半自動的作成できるようにするため,対訳文に対する形態素解析結果の誤りを人手修正し,正しい形態素解析結果を準備する.

(2)
日英文の自立語の意味的対応づけ

 上記の結果と日英対訳辞書を使用して,日英例文中で意味的に対応関係を持つ自立語を自動的に対応づけ,それを変数化候補とする.なお,意味対応関係を持つ部分の文法属性(品詞など)が異なるものについても変数化の候補とする.

(3)
関数化対象表現の抽出

 関数化の対象となる字面を予め関数毎にグループ化し,グループ化された対応表と(1)の結果を参照して,関数化候補箇所を自動抽出する.

(4)
その他の各種要素の記述支援

 任意要素,補完要素の指定,冠詞と丁寧表現の汎化などについても可能な限り判断規則を設け,その候補となる要素を自動抽出する.

これらの方法で抽出された汎化候補に対して,線形要素であることが機械的に明確に判定できるものについては,機械的に変数化,関数化を行う.また,機械的な判断規則が得られないものは候補のまま残し,言語アナリストの判断にゆだねる.言語アナリストが判断に迷うものについては,設計者との協議により個別に扱いを決定する.

図 1: 文型パターン化の作業手順
[keepaspectratio,height=.9]zu.eps



平成16年8月30日