まず、品詞情報を原文データに埋め込む。その際には置き換えを施さないもの にのみ品詞情報を付加した。N-gram出力結果から単文、重文、名詞句の文型 の種類毎の抽出条件を満たす表現のみを選択する。表現の抽出条件を表 6示す。
表4の置き換えテーブルと、表6の抽出条 件はセットになっている。表4の置き換えを行ない、表 6の抽出条件により、言い回しを抽出した。
品詞情報による抽出条件(表6)を、重文の場合を例に説明する。重文とは、「動詞〜接続助詞〜動詞」の文型をしているので、重文のみを抽出する場合は抽出条件を「動詞+接続助詞+動詞」とするよう定めた。