まず,ルールの抽出について述べる.階層型統計翻訳においても,学習データに表われるルールを 全て列挙することは現実的でない.そこでルールを全て列挙することは行わず, ルールとして正しそうなもののみを抽出することになる.まず,階層でないフレーズモデルにおいて フレーズペアを抽出する.これで得られるフレーズペアの集合には,フレーズペアとして同じ 単語アラインメントを持っているものが複数あるため,フレーズペアとして最小であるものを選ぶ. これによって得られたフレーズペア集合を初期フレーズペア(initial phrasepair) 集合と呼ぶ. 初期フレーズペアが得られると,以下の定義に従ってルールを得る.