この方法では文章単位のテンプレートを生成する.
文書群を階層クラスタリングによってクラスタリングし表を生成する.その表に対して各列を変数のグループとし,左の列から順に変数X0,X1...のグループとする.手順の概略を図3.2に示す.
表の列は情報のクラスタ毎に,行は文書として整理されている.列「重量」に含めれている文字列は変数X1となり,列「価格」に含まれる文字列は変数X2となる.よって,「重量は約130gだ。」がX1に,「価格は56000円。」がX2に置換され,「X1。X2」というテンプレートが生成される.
Figure 3.2:
文章レベルでのテンプレート生成の例
57#57
|