DB文自身をそのまま入力文として 使用することで、共通のパターンを発見する。 DB文を入力文として使用していくと、 入力文1にはパターンA・B・C、入力文2にはパターンA・D… というように各文に対して最も一致の多いパターンが得られる。 この時得られた固有のパターンをカウントする。
なお、「NはNだ」や「NのNはNだ」 というパターンのように、 互いに共通部分を含むようなパターンはそれぞれ 個別に扱う。