半自動化を考慮した作業手順を図1に示す.図1の手順で重要な点は以下の通りである.
対訳文の形態素解析結果から,文型パターンを半自動的作成できるようにするため,対訳文に対する形態素解析結果の誤りを人手修正し,正しい形態素解析結果を準備する.
上記の結果と日英対訳辞書を使用して,日英例文中で意味的に対応関係を持つ自立語を自動的に対応づけ,それを変数化候補とする.なお,意味対応関係を持つ部分の文法属性(品詞など)が異なるものについても変数化の候補とする.
関数化の対象となる字面を予め関数毎にグループ化し,グループ化された対応表と(1)の結果を参照して,関数化候補箇所を自動抽出する.
任意要素,補完要素の指定,冠詞と丁寧表現の汎化などについても可能な限り判断規則を設け,その候補となる要素を自動抽出する.
これらの方法で抽出された汎化候補に対して,線形要素であることが機械的に明確に判定できるものについては,機械的に変数化,関数化を行う.また,機械的な判断規則が得られないものは候補のまま残し,言語アナリストの判断にゆだねる.言語アナリストが判断に迷うものについては,設計者との協議により個別に扱いを決定する.