next up previous contents
Next: 新聞記事のパターン抽出 Up: パターン抽出への応用 Previous: 本手法の類似文検索以外の利用法

応用方法

DB文自身をそのまま入力文として 使用することで、共通のパターンを発見する。 DB文を入力文として使用していくと、 入力文1にはパターンA・B・C、入力文2にはパターンA・D… というように各文に対して最も一致の多いパターンが得られる。 この時得られた固有のパターンをカウントする。

なお、「NはNだ」や「NのNはNだ」 というパターンのように、 互いに共通部分を含むようなパターンはそれぞれ 個別に扱う。




2002-03-06